Gene Caul_5131 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5131
Symbol
ID	5897357
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010335
Strand	-
Start bp	49897
End bp	51105
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	68%
IMG OID	641555234
Product	major facilitator transporter
Protein accession	YP_001676565
Protein GI	167621780
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00880] Multidrug resistance protein

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.229934
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACGCGT CCAAACCTCA ACCGCGCGAG GCACTGCCGC TCGCGCTTTT CGTTCTGACC 
TTGAGCATCT TCGCGATCGG CACCTCTGAG TTCGCCATCG CCGGCCTGCT GACCGAAGTG 
GCGTCCGATC TGTCGGTGTC GATCTCCGCC GCCGGGCGCT TGGTGGCGGC GTACGCCTTG 
GGCGTGGCGA TCGGCGGGCC GATCATGGCC GTGCTGACCG CGCGGCTGCC GCGCAAGACG 
TCCCTGATGG TGCTGATGGC GATCTTCGCG GTGGGCAACG CCGCCTGCGC CCTGGCCATC 
CACTACGAAC ATCTGGCGCT CGCCCGCGTC GTCACCTCCT TGGGCCATGG CGCGTTCTTC 
GGCATCGGCG CGGTGCTGGC CATGAGCCTG GTTCCCGATC ACCGAAAGGC CTCGGCGGTG 
GCGGTGATGT TCGCCGGCTT GACCATCGCC AACATCCTGG GCGTGCCGCT GGGCACGGCC 
CTGGGTCAGT GGGCCGGCTG GCGCGCGCCG TTTTGGGCGA TCACCGCCTT GAGCATCGCG 
GCTCTGGTCG CGATCCTGAC GATGGTGCCC GACCGGCGCG ACGACGCGCC GCCCAACTTC 
GCCGATGAGG CCCGCGCGCT CGCTGACGGC GGTCTTTGGG TCGCCCTCCT GACAACGGTG 
GCCTTCGCCA CGTCGATCTT CCTGCTGTTT TCCTACGTCG CGCCCCTGCT CACCCAGGCG 
TCGGGTGTTT CGCCCGGCGG CTTGACGCTC AGCCTGCTGT CGATCGGATT GAGCCTGGCC 
GTGGGCAATA TTCTGGGGGG ACGTCTGGCG GACTGGAACC TGGGACGCGC CTTGGTCGGC 
ATCGCCGTCG TCATCGCCGC AGTTTCCGGT CTGCTGGCCT GGAGCAGCGC GCATCTGCCG 
GCGGCGGAGA TTAATTGGTT CGCTTGGGGC GTGGTGACGT TCGCCGCCGT GCCCGCCTCC 
CAGGTCAACG TCATGCAACT AGGCCACAAG GCGCCCAACC TCGTCTCGAC GCTGAACATC 
TCGGCGTTCA ACATCGGCAT CGCCACCGGC TCCTGGCTTG GCGGACAACT GCTCGACCAA 
GGCGCGCGCC TGACCGACTT GCCGCTCGCC GCGGCGAGCG TGGCTGTGGC CGCGGCGGCC 
CTGGCCTTCG CTTCGCAAAG GATCGCCCAA GGACGGCGCG CGCACGCCAG CGCGCCCGAA 
ATCATCTAG

Protein sequence

MNASKPQPRE ALPLALFVLT LSIFAIGTSE FAIAGLLTEV ASDLSVSISA AGRLVAAYAL 
GVAIGGPIMA VLTARLPRKT SLMVLMAIFA VGNAACALAI HYEHLALARV VTSLGHGAFF 
GIGAVLAMSL VPDHRKASAV AVMFAGLTIA NILGVPLGTA LGQWAGWRAP FWAITALSIA 
ALVAILTMVP DRRDDAPPNF ADEARALADG GLWVALLTTV AFATSIFLLF SYVAPLLTQA 
SGVSPGGLTL SLLSIGLSLA VGNILGGRLA DWNLGRALVG IAVVIAAVSG LLAWSSAHLP 
AAEINWFAWG VVTFAAVPAS QVNVMQLGHK APNLVSTLNI SAFNIGIATG SWLGGQLLDQ 
GARLTDLPLA AASVAVAAAA LAFASQRIAQ GRRAHASAPE II