Gene Caul_0921 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0921
Symbol
ID	5898376
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	967893
End bp	969260
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	73%
IMG OID	641561404
Product	major facilitator transporter
Protein accession	YP_001682550
Protein GI	167644887
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.224208
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.285654
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCGAG TCGCTCTCCC GCCCCGTCTG CCGCTGATCC TGGCGGCGGC CAGTTTCGGC 
TTCACGATCG TCCAGCTAGA CGTGACCATC GTCAATGTGG CGCTGGACGC CATCGGCCGC 
GAGTTCGGCG CCCCGACCGC CAGCCTGCAA TGGGTGGTCG ACGCCTACAC CCTGCTGCTG 
GCGGCGCTGT TGCTAAGCGC CGGGGCGCTG GGCGACCGGT TTGGGCCGCG CCGGGCGTTT 
CTGGCGGGGC TGGTGCTGTT CGCGGTGTCG TCGGCGGCCT GCGGCCTGGC CCAGACCAGC 
CTGCAACTGA TCCTGTCGCG CGCCGTCCAG GGGGGCGCCG CCGCCCTGCT GGTGCCGCCC 
TCGCTGGCCC TGATCACCCA CGCGGCGGCC GGCGACGACT GGGCGCGGGC CTGGGCCGTG 
GGCTGGTGGA CGGCGGCCGG CGGGGTGTCG ATCGCCGCCG GGCCGGTGAT CGGCGGCTTG 
CTGATCGGGG CGTTCGGCTG GCGCTGGGTG TTTCTGGTCA ACCTGCCGCT CTGCCTGCTG 
GGCGCGGCGG CGACCCTGGC CTTCGTGCCC GAGGTTCCGC CGCGCGAGAA GCGGCCGCTG 
GACCTGCCCG GCCAGGTCCT GGGCTTCGTG GCGCTGACCC TGCTGGTCGG GGCGGTCATC 
GAGGGCGGTC ACAGGGGCTG GAGCGACCCG CTGGTGCTGG GCGCCCTGAT CGGCGGCTTG 
GCGGCCGTGG CGGCCTTCCT GGCGGTCGAG ATGGGCAGCG CCCATCCAGC GGTCCCCTTG 
GACGTGTTCC GGGGCCGCAT GGTCTGGTCG GCGGCGGTGG TCGGGACGGC GGTGAACTTC 
ACCTATTACG GCGTGATCTT CGTGCTCGGC CTCTTCCTCC AGCGCTCGGC CGGCTACAGC 
GTGGTGCAGG CCGGCCTGGC TTTCCTGCCG CTGACGGCGA CCTTCATCAT TTCCAACCTC 
TTGAGCGGGC GCGTCTCCCA TCGCTTCGGC CCGGCCCGGA CCATGGCCGG CGGGGTGCTG 
GTGGCGGCGC TCGGCTACGC CCTGACCAGC CGGCTCACGC CGACCACGCC GTTCTGGTTG 
ATGATTCCGG GCTTCCTGCT GATCCCCGGC GGCATGGGCA CGGCGGTGCC GGCCATGACC 
AGCGCGCTGC TGGCCAATGT GGACCGGCAC TTCTCTGGCA CGGCGTCGGG GGTTCTGAAC 
GCTTGCCGCC AGGCGGCGGG GGCGGCCGGC GTGGCGGTGA TGGGGGCGCT GGCGGCGGGC 
GGACCCGAGC GGATCGCGGC GGGGCTGCGG GCGTCGGGGC TGATCGCGGC GGTGGTGCTG 
CTGGGCACGG CGGTGGTGGC TTGGCGGAGC GAGGGGGAGG CTATCTAA

Protein sequence

MTRVALPPRL PLILAAASFG FTIVQLDVTI VNVALDAIGR EFGAPTASLQ WVVDAYTLLL 
AALLLSAGAL GDRFGPRRAF LAGLVLFAVS SAACGLAQTS LQLILSRAVQ GGAAALLVPP 
SLALITHAAA GDDWARAWAV GWWTAAGGVS IAAGPVIGGL LIGAFGWRWV FLVNLPLCLL 
GAAATLAFVP EVPPREKRPL DLPGQVLGFV ALTLLVGAVI EGGHRGWSDP LVLGALIGGL 
AAVAAFLAVE MGSAHPAVPL DVFRGRMVWS AAVVGTAVNF TYYGVIFVLG LFLQRSAGYS 
VVQAGLAFLP LTATFIISNL LSGRVSHRFG PARTMAGGVL VAALGYALTS RLTPTTPFWL 
MIPGFLLIPG GMGTAVPAMT SALLANVDRH FSGTASGVLN ACRQAAGAAG VAVMGALAAG 
GPERIAAGLR ASGLIAAVVL LGTAVVAWRS EGEAI