Gene Caul_1551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1551
Symbol
ID	5899006
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	1640760
End bp	1642064
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	66%
IMG OID	641562039
Product	L-fucose transporter
Protein accession	YP_001683179
Protein GI	167645516
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0738] Fucose permease
TIGRFAM ID	[TIGR00885] L-fucose:H+ symporter permease

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAAAA GCCCGCAGGG AAGGACCACG TTCGCGCCGC TGGTTCTCAT CGTCGCCCTC 
TTCTTCCTTT GGGGCATCGC CAACAATCTC AACGACGTCC TAATTCCCCA TTTGAAGAAG 
GCTTTCTTTC TCACCGACCT GCAGTCCGGC CTGGTGCAAT CGGCCTTCTA TCTTGGCTAT 
TTCTTCCTGG CCCTGCCGGC CAGCGTCGTC ATGCGACGCC ACGGCTACAA GGCGGCGGTG 
ATCGTCGGTC TGCTGCTGTT TGGTCTGGGC GCCTTGTTGT TCTATCCCGC CGCCGAGGCG 
CGGCAGTATT CCTGGTTCCT GGCCGCCCTG TTCGTCCTGG CCTCGGGCCT GGCTTTCCTG 
GAGACCTCGG CCAATCCGCT GATCACGGTG CTGGGCGATC CGGCCAAGGC CGAGCAGCGC 
CTCAACTTCG CGCAGGCCTT CAATCCGCTG GGCTCGATCA CCGCCGTGGT GGTGGGGCGC 
CAGTTCATCC TGTCGGGCGT GGAGCCGACG AAAGCGCAGT TCGCCGCCAT GACGCCGGCG 
CAACTTCAGG CCTTCCAGAC CACCGAGGCC CAATCCACCC AGATTCCCTA TCTGATCATC 
GCCGCCGTTG TGCTGGCCTG GGCGCTGCTC GTGGTCGTCA CCAAATTCCC CCGCCAGGCC 
GGACGCCCGG ACCCAAACGA GGCCGACGCC GCCCTGCCCG CCGCCCAGGC CGTTCCCGCC 
CTGCTGGCGC GACCGCGGTT CCTGTTCGGC GTGGCGGCCC AGTTCTTCTA CGTCGGCGCC 
CAGGTCGGCG TCTGGAGCTA CATGATCCGC TACGCCCAGC ACGAGGTTCC GGGCATGGGC 
GAGAAGACGG CGGCGGCCTA CCTGTCATGG TCCCTGGTCG GGTTCATGGC CGGACGTTTC 
ATCGGTACGG CCGCGATGAG CCGGGTCAGC CCCTCGCTGA TGATGGGCGT GTTCGCCATG 
ATCAATGTCG GCCTGACCCT GGTCGCGGTC GTCGCAGGCG GAAAGGTCGG GCTGTACGCC 
CTGGCCGCCA CCAGCGTCTT CATGTCGATC ATGTTCCCCA CCATCTTCGC CGCCTCGCTG 
AAGGGGCTAG GACCGCTGAC CAAGACCGGT TCATCCTTCC TGGTGATGAG TATCATCGGC 
GGCGCGGTCC TGACGGCGGT GATGGGGGGC GTCTCGGACG CCAGCGCCAT CAACGTCGCC 
ATCCTGGTGC CCTGCGCCTG CTTCGCTGTG GTCGGCCTGT TCGGTTTCAC TGCTGGCCGC 
ACGGCCAGCC AGGACCTGAA GACCGCTCCC GTCGGAGCGC ACTAG

Protein sequence

MEKSPQGRTT FAPLVLIVAL FFLWGIANNL NDVLIPHLKK AFFLTDLQSG LVQSAFYLGY 
FFLALPASVV MRRHGYKAAV IVGLLLFGLG ALLFYPAAEA RQYSWFLAAL FVLASGLAFL 
ETSANPLITV LGDPAKAEQR LNFAQAFNPL GSITAVVVGR QFILSGVEPT KAQFAAMTPA 
QLQAFQTTEA QSTQIPYLII AAVVLAWALL VVVTKFPRQA GRPDPNEADA ALPAAQAVPA 
LLARPRFLFG VAAQFFYVGA QVGVWSYMIR YAQHEVPGMG EKTAAAYLSW SLVGFMAGRF 
IGTAAMSRVS PSLMMGVFAM INVGLTLVAV VAGGKVGLYA LAATSVFMSI MFPTIFAASL 
KGLGPLTKTG SSFLVMSIIG GAVLTAVMGG VSDASAINVA ILVPCACFAV VGLFGFTAGR 
TASQDLKTAP VGAH