Gene Caul_1766 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1766
Symbol
ID	5899221
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	1865465
End bp	1866739
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	66%
IMG OID	641562256
Product	major facilitator transporter
Protein accession	YP_001683393
Protein GI	167645730
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.601014
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.308968
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGCTC CAACGATGCC GGCGCCTTCC GAGAAGATCG GGCGGTACAG GTGGGTGATT 
GTCGGCCTGC TGTTCCTGGC CATGGTGATC AACTATGTCG ACCGCCAGAC GATTGGCCTG 
CTGAAGGCCG ATCTCTCCAA GGAATTCGGC TGGGACGAGA CCCACTACGC CGACCTCGTC 
TTCTACTTCC AGCTGGCCTA CGCCGTGGCC TATCTCGGTT GGGGCAAGGT GATGGACAAG 
ATCGGGGCCC GCTGGGGCTT CGGCATCGCC TTCCTGATCT GGCAGGTCGC CCACATCGGT 
CACGCCCTGG CGCGCGGCTT CGGCGGCTTC GCCATCGCTC GCATGGGCCT GGGTATCGGC 
GAGGCCGGCG GCTTCCCGGG CGGCATCAAG GCCGTGGCCG AGTGGTTCCC CAAGAACGAG 
CGGGCCCTGG CCACCGGCAT CTTCAACGCC GGCACCAATA TCGGCGCCAT CGTCACGCCG 
CTGGTGGTGC CGGGCATTGT CCTGGCCTTC GGCTGGCAGA TGGCCTTCAT CGTCACCGGC 
GTGGCCGGCC TGATCTGGCT GCCGCTGTGG CTGATCGTCT ATCGCCGCCC GCGCGAGCAG 
ACGCGCCTGT CGGCCGCCGA ACTGGCCCAT ATCGAGCAGG ACCCCGCCGA CCCCGTCGAG 
AAGATCGGCT GGGCCAAGCT ACTGACCAAG AAGGAGACCT GGGCCTACGC CCTGGGCAAG 
TTCCTGATCG ATCCGATCTG GTGGATGTTC CTGTTCTGGC TGCCCGACTT CCTGGGCAAG 
CGCTATCACC TGGACCTGAA AACGTTCGGC CCGCCGCTGA TCGCCATCTA TCTGATGAGC 
GACGTCGGCA GCGTCGGCGG CGGCTGGCTG TCGTCCTCGC TGATGAAGCG CGGCTGGAGC 
ATCAACAAGG CCCGCAAGAC CACCATGCTG GTCTGCGCCC TGCTGGCCAC GCCGGTGATC 
TTCGCCGCCA ATGTCGACAG CCTGTGGGCC GCCGTGCTGA TCATCGGCGT CGCCACCGCC 
GCCCACCAGG GCTTTTCGGC CAACCTCTAC ACCCTGCCGT CGGACGTCTT CCCGCGCGGC 
GCCGTGGGCT CGGTGGTCGG TATCGGCGGC ATGCTGGGCG CCGTCGGCGG CATGGTGTTC 
TCCAAGTATA TCGGCAAGGT CCTGGACCAG ATCGGCACCT ACACGCCGAT CTTCCTGGTC 
GCTGGCAGCG CCTATCTGGT CGCCTTGCTG GTCATCCACC TGCTGACCCC GAAGATGGAG 
CCGGTGAAGG TCTAG

Protein sequence

MDAPTMPAPS EKIGRYRWVI VGLLFLAMVI NYVDRQTIGL LKADLSKEFG WDETHYADLV 
FYFQLAYAVA YLGWGKVMDK IGARWGFGIA FLIWQVAHIG HALARGFGGF AIARMGLGIG 
EAGGFPGGIK AVAEWFPKNE RALATGIFNA GTNIGAIVTP LVVPGIVLAF GWQMAFIVTG 
VAGLIWLPLW LIVYRRPREQ TRLSAAELAH IEQDPADPVE KIGWAKLLTK KETWAYALGK 
FLIDPIWWMF LFWLPDFLGK RYHLDLKTFG PPLIAIYLMS DVGSVGGGWL SSSLMKRGWS 
INKARKTTML VCALLATPVI FAANVDSLWA AVLIIGVATA AHQGFSANLY TLPSDVFPRG 
AVGSVVGIGG MLGAVGGMVF SKYIGKVLDQ IGTYTPIFLV AGSAYLVALL VIHLLTPKME 
PVKV