Gene Caul_1938 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1938
Symbol
ID	5899393
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	2078103
End bp	2079434
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	68%
IMG OID	641562428
Product	major facilitator transporter
Protein accession	YP_001683565
Protein GI	167645902
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.829808
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.641646
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGAAGA CGCTGACCGA CAAACTCGCG AACGCCAAGG ACTCCCGCTA TCGCTGGCTG 
GTCCTGGCGG TGCTGACCGC CGTGCATTCG ACCCACCACA TCGACCGCAA CGTCCTGTCG 
GTCGTCGTCG AGCCGATCCG GCAGGAGTTT CATCTCAGCG ACAGCCAGAT GGGAATGCTG 
GGCAGCCTGG GCTACGCGCT GGCCTTCGCC ATCGCCGCGA TACCCATGGG GTATCTGGTC 
GACCGGGTGA ACCGCCGTAA CATGCTGGTC GGCATCCTGG CGCTGTGGAG CGTGATGACG 
GCGGTCTGCG CCTCGGCCAA CAGCTACGTG CACCTGTTGC TGGCCCGGAT GGGCGTCGGC 
ATCGCCGAGT CCGGCGGCGC CCCGACCGCC ATGTCGATGG TCTCTGACTA TTTCCCGCCC 
AAGCAGCGGT CGACGGCGAT CGGCATCTGG TACCTGAGCT CGGCGATCGG CACCGGGATC 
ATCTTCCTGG TCGGTGGCTT CCTGGCCCAG TCGTTCGGCT GGCGCACGGT GTTCCTGGTG 
GCGGGCGTAC CCGGCCTGGT GATGGGTCTG ATCCTGTTCT TGGTCGTGCG CGAACCCCCG 
CGCGGCGGAT CGGAGGTCGT GGCCCTCGAT ACGCCGGAAA CCACGCCCGC CGCGACCGTC 
GACACCCCGG AAAAAGCCGC CACCCCGCGC GAGGCCTTCG CCTACGTGAT CCGCCGCCCG 
GCCATTCTGA GCATGATGGC CGGCATCGTC CTGGCCGCCG CGATGAGCTC GGCCTTCGCC 
CTGTGGTCGG TGTCGTTCCT CGTGCGGGTT CACCACATGC CGCTGGCCCT CGCCGGCGTA 
TCGATCGCCG CGGCCTTCTC GGTGTTCGGC ATCATCATTC CGTTGATTTC CGGCGTGATG 
GGCGACCGGC TGTCGAACGC GAAGGACGGT CACAGGCCCG AGCGCCTGGC CCTGCTCAGC 
GCCACGACCA TGACCGGCGT GGTCCTCTGC GGCGTCGCGG CCGCCTTGTC CGGCAGCGCG 
CCCGTCGCGG TGGCGATGAT GTGCCTGTGG TGCGGTCTGA TGCTGGCCCA CAACGGACCG 
GCCAACGCCC TGGTCCTCAG CCTGCTTCGC CCCCGGATGC GGGGGGTCGT CGTCGCCACG 
CTGCAGACCG TCGCGACGGT GGTCGGCACG GCGCTGGGCC CCTTTCTGGT GGGCGTGCTC 
AGCGACGTCT ATGGCGGCCC CAACTCGCTG CGGTGGGCCA TCATGACCGG CATGTCGCTG 
AACGTCGTGG CGGTGCTGTG CTTCCTCAAC GCGGCTAGGA CCGCCCGCCG GGATTCCCTG 
CTGGACGGCT AG

Protein sequence

MPKTLTDKLA NAKDSRYRWL VLAVLTAVHS THHIDRNVLS VVVEPIRQEF HLSDSQMGML 
GSLGYALAFA IAAIPMGYLV DRVNRRNMLV GILALWSVMT AVCASANSYV HLLLARMGVG 
IAESGGAPTA MSMVSDYFPP KQRSTAIGIW YLSSAIGTGI IFLVGGFLAQ SFGWRTVFLV 
AGVPGLVMGL ILFLVVREPP RGGSEVVALD TPETTPAATV DTPEKAATPR EAFAYVIRRP 
AILSMMAGIV LAAAMSSAFA LWSVSFLVRV HHMPLALAGV SIAAAFSVFG IIIPLISGVM 
GDRLSNAKDG HRPERLALLS ATTMTGVVLC GVAAALSGSA PVAVAMMCLW CGLMLAHNGP 
ANALVLSLLR PRMRGVVVAT LQTVATVVGT ALGPFLVGVL SDVYGGPNSL RWAIMTGMSL 
NVVAVLCFLN AARTARRDSL LDG