Gene Caul_1420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1420
Symbol
ID	5898875
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	1509880
End bp	1511283
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	64%
IMG OID	641561907
Product	major facilitator transporter
Protein accession	YP_001683048
Protein GI	167645385
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0738] Fucose permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGGTA TGGGTGCGGC GCAGGCTCCG AATTCCGGAG CGGGCGCCAA GTCAGGGGGA 
GGCGGCCTGA TCCTGGCCGT CGTCTACGTC ACCGCGCTCT TCTTCATCTG GGCGTTCGTC 
ACCAATCTGA TCGACCCGCT CGTGAAGAGC ATGAAGGTCA TCTACACGCT CACCGACTTC 
GAGACGCAGC TGAACCAGTT CGCGTTCTTC ATCGCCTATG GCGTGATGTC GATCCCGTCG 
GCGGGCTATC TGGCCAAGAA CGGCTATGCC AAGTCGATCG TGCTGGGGCT CACCGGCATC 
GTCGCCGGTT GTCTGATCGC CTGGTCGACG ACCTTCTCGC ATAACTTCAT CACCGTGCTG 
CTGGGCCTGT TCGTGGCCGC CTCGGGCATC ACCCTCCTGC AGGTCGCCGC CAACCCGCTG 
ATCGCCTCGA TGGGCAATCC GAAGGGCTCG CACTTCCGCC TCAACCTCTC GCAGGCCTTC 
AACTCGATGG GCGCCTATCT GGGCGGCATC TTCGGCGCCG GCTTCCTGCT GAAGGGGCCG 
TTGTTCGAGA AGGACGTGGT GATCACCGAG GCCATGAAGA CGACCGGCCT GGGCTTCGTC 
ACCAACGTCT ATCTGATGAT CGCGGTGATC CTGGCCTTCT TCACCCTGGC CGTGTTCCTG 
GTGCGCAACA CCATCACCCA CCACGCGCCG AAGATGGCCG AGCACTCGGA ATCCCCGTTC 
AAGGCGCTGG AGTCCAAGTG GGCCAATCTA GGCGCACTGG GCATCTTCCT CTATGTCGGC 
GCCGAGGTCT GCGTGATCTC GGGGATGATC TTCTTCCTCG AACAGAAGCA GATCCTCAAC 
GTGCCGTCGC AGGTCGCCGG CTTCGTCGGC CCCATCTTCA TGCTGTTCGC GATGTTCGGC 
CGGTTCGGTG GCTCCGTGCT GCTGCGCTAC GTCAAGGCCA CGACCATGCT CGCCGTGGTG 
GCCGCCTGCG CCACTGGCCT TTGCGCCCTG GTCATCGCCA CCTACCAGAT GCCGGCTACC 
CCGCTGGGCG GCACGGTCCA CCTGCCGGGC GACTTCGTCG CGCCGCTGAC CATGGGCTTC 
ATTCCGGGCG TCGCGGCGAT CCTGATCGGC CTGTTCAACT CGATCATGTT CCCGACGATC 
TTCACCATCA CCCTGGAACG CTCGTCAGCC CCGGCCTCGG CGACTTCAGG TCTGATGTGC 
ATGGCGATCT GCGGCGGCGG GTTCATCTCG ATCCTGTACG GCTTCACGGT CGACCAGTTC 
GTGGCCCACT TCTCGGTCGG GGCCCGCTCG CTGGCCTTCA TCGTGCCGCT GGTCTGCTAT 
CTGTACGTCC TGTGGTTCTC GTTCGCCGCC CGGCGCGCGC CGATCCATGA GATCCAGGAG 
GATGCGGTGG CCGCCGGTCA CTAG

Protein sequence

MAGMGAAQAP NSGAGAKSGG GGLILAVVYV TALFFIWAFV TNLIDPLVKS MKVIYTLTDF 
ETQLNQFAFF IAYGVMSIPS AGYLAKNGYA KSIVLGLTGI VAGCLIAWST TFSHNFITVL 
LGLFVAASGI TLLQVAANPL IASMGNPKGS HFRLNLSQAF NSMGAYLGGI FGAGFLLKGP 
LFEKDVVITE AMKTTGLGFV TNVYLMIAVI LAFFTLAVFL VRNTITHHAP KMAEHSESPF 
KALESKWANL GALGIFLYVG AEVCVISGMI FFLEQKQILN VPSQVAGFVG PIFMLFAMFG 
RFGGSVLLRY VKATTMLAVV AACATGLCAL VIATYQMPAT PLGGTVHLPG DFVAPLTMGF 
IPGVAAILIG LFNSIMFPTI FTITLERSSA PASATSGLMC MAICGGGFIS ILYGFTVDQF 
VAHFSVGARS LAFIVPLVCY LYVLWFSFAA RRAPIHEIQE DAVAAGH