Gene Caul_3590 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_3590
Symbol
ID	5901045
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	3874571
End bp	3876043
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	70%
IMG OID	641564100
Product	NCS1 nucleoside transporter
Protein accession	YP_001685215
Protein GI	167647552
COG category	[F] Nucleotide transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG1953] Cytosine/uracil/thiamine/allantoin permeases
TIGRFAM ID	[TIGR00800] NCS1 nucleoside transporter family

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.483466
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCACG ACCAAGCCGG CAACACCCTC TGGAATCCGG ACCTGGCGCC GACCACGGCC 
GACCAGCGCA CCTGGAAGGC GCGGCATTTC GCGGCCCTGT GGCTGGGCAT GGTCATCGCC 
GTGCCGGCCT ACATGCTGGC CGCGGGCCTG ATCGAGCAGG GGATGTCGGC GAGCCAGGCG 
GTGTGGGCCG TGCTGCTGGG CAATGTCATC GTGCTGATCC CGATGCTGCT GATCGGCCAT 
GCCGGCGCGA AATGGGGCGT GCCCTACGCG GTGCTGGCCC GGGCTTCGTT CGGCTGGCGC 
GGCGCTCGCG CGCCGGCCTT GGCCAGGGCG ATCGTCGCCT GCGGCTGGTA CGGCATCCAG 
ACCTGGATCG GCGGCGGGGC GCTGCTGACC CTGCTGGGCG TGATGGTCGG CAAGAGCCTG 
GTCGGACCAC TGATCCCGGT GCTGGGCATC GGCGTCGGCC AACTGCTGTC GTTCGCCGCC 
TTCTGGCTGA TCCAGCTGCT GTTCGTCACC AAGGGCCTGG AGACCGTGCG CAAGCTCGAG 
ACCTGGACCG CCCCGGTCAA GATCCTGGTC TGCGGCCTGC TGGTCTGGTG GGCGCTGTCC 
AAGGCCGGGG GCCTGGGCCC CATCCTGCAC GAGCCCAGCG CCTACGACGC CGGCGGCGCC 
AAGGCCGGCC GGTTCTGGAA GGACTTCGGC CCGGCCGTCA CCGCCATGAC CGGCTATTGG 
GCGACCCTGG CCCTGAACAT CCCCGACTTC ACCCGCTTCG CCCGCACCCA GCGCGACCAG 
ATCGTCGGTC AGGTCGTGGG CCTGCCCGGA CCCATGGCCC TGCTGGCGAC GATGAGCGTG 
ATCGTCACCT CGGCCACGGT GCTGATCTTC GGCAAGCCGA TCTGGGACCC GGTGGCCCTG 
GCCGGCGACA TCGGCGGGAT CGGCGTGCTG GTGGGCCTGC TGGTCATCAG CCTCGACACC 
GTGTCGTGCA ACATCGCCGC CAACCTGGTG GGGCCGGCCT ACGACTTCTC GGCCCTGTGG 
CCGAGCAAGA TCAGCTACCG CACCGGCGGC TACATCACCG CCGCGATCGG CGTGCTGATC 
ATGCCGTGGA AGCTGCTGGA GAGCACGCAA GGCTACATCT TCGTCTGGCT GACCGGCTAC 
GGCGCGCTGC TGGGGCCGGT GGCCGGGATC CTGATCGCCG ACTACTGGCT GCTGCGCCGC 
GCCCGCCTGG ACGTCGAGGC GCTGTATGAT CGGACCGGGA GATATAGTTA CTTCAAGGGC 
TGGAACCTGG CGGCCGTGGC GGCTTTCGTC ATCGGCGTCG CGCCGAACCT GCCGGGTTTC 
CTGAAGGCGG CCGGCCTGCC GGCGGCGTCG GGGATCGGGG CGCCGTGGAC GGGGCTTTAT 
GATTATGCGT GGTTCGTCGG GGCGGGGATC GCGGCGGGGG TCTACGTGGC GGCGATGCGG 
TTGGGGGATG GGGCGCGGGC GTCGGCTGTT TAG

Protein sequence

MDHDQAGNTL WNPDLAPTTA DQRTWKARHF AALWLGMVIA VPAYMLAAGL IEQGMSASQA 
VWAVLLGNVI VLIPMLLIGH AGAKWGVPYA VLARASFGWR GARAPALARA IVACGWYGIQ 
TWIGGGALLT LLGVMVGKSL VGPLIPVLGI GVGQLLSFAA FWLIQLLFVT KGLETVRKLE 
TWTAPVKILV CGLLVWWALS KAGGLGPILH EPSAYDAGGA KAGRFWKDFG PAVTAMTGYW 
ATLALNIPDF TRFARTQRDQ IVGQVVGLPG PMALLATMSV IVTSATVLIF GKPIWDPVAL 
AGDIGGIGVL VGLLVISLDT VSCNIAANLV GPAYDFSALW PSKISYRTGG YITAAIGVLI 
MPWKLLESTQ GYIFVWLTGY GALLGPVAGI LIADYWLLRR ARLDVEALYD RTGRYSYFKG 
WNLAAVAAFV IGVAPNLPGF LKAAGLPAAS GIGAPWTGLY DYAWFVGAGI AAGVYVAAMR 
LGDGARASAV