Gene Caul_2075 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_2075
Symbol
ID	5899530
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	2221437
End bp	2222744
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	68%
IMG OID	641562564
Product	major facilitator transporter
Protein accession	YP_001683701
Protein GI	167646038
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.560518
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGATC CGTCCATCGA CATGGCCCCC GACCTGGAGC GCGCCACCGT CGGCCGGGTG 
ACAAGGCGGC TGATGCCGCT GTTCTGCCTG ATGTACCTGA TCGCCTACAT CGATCGGCAG 
AACGTCTCGT ACGCCAAGCT CGACATGGTC CATGCCCTGG GCCTCACCGA GGCGGCCTAC 
GGCCTGGGCG CGTCGCTGTT CTTCATCGGC TATTTCCTGT TCGAGGCGCC GTCCAACCTG 
ATCCTGGCCC GGGTGGGCGC GCGGGTCTGG TTCGCGCGGA TCATGTTCAC CTGGGGTCTC 
GTCACCCTGG CCCTGGGTTT CACCCAGAAC GCGACGATGT TCTACGTTCT GCGCTTCCTG 
CTGGGGGTCA CCGAGGCGGG GTTCTTTCCG GGCGTGCTCT ATGTCCTGAC CCTTTGGTAC 
CCGCAGGCCC ATCGGGGCCG GATGGTGGGC TTGTTCATGA TCGCCAGCGC CGTCGCCAAC 
GCCGTCGGGG CGGTGTTGGG CGGCCTGCTG CTGGATCTGG ACGGAACGCT GGGACTGGCG 
GGCTGGCAAT GGGTGTTCCT GGTCACCGGC GTTCCGGCCG TCCTGCTGGC GCCCTATGTC 
CTGTGGCGGC TGCCGGACGG TCCGACCAAG GCGCGCTGGC TGCCGGAGGC CGAACGGGCC 
TGGTTGGCCA AGGTTCTGGA TACGGAGCGG GGCGGGGTGG TCGATGATCA TCGCGGCGCC 
TGGAAGGCGA TCTTCGACCC GCGCGTGCTG CTGCTGGCGG GCCTCTATAT CGGCATGCCG 
CTGGGCGCCT ACGGCCTGAG CTACTGGCTG CCGACCATCG TCAAGTCGTT CGGCGTCTCC 
AACAGCGTGA ACGGCCTGAT TAATGTCATC CCCTGGCTGC TGGTCGCTGT GGCCCTGTGG 
TTCGTGCCCC GCCACGCCGC GCGCCATGGC GCCAGCGCCT GGCACATCGC CGGACCGTGC 
CTGCTCGGCG CCCTTGCCCT GGTCTTGAGC GTGATCGTGC CGGGCTCGGC GTTGAAGTTC 
GCCATGTTGT GCCTCGCCGC TCCGGCCATC TTCGCGGCCC AGCCGGTGTT CTGGAGCCTG 
CCGCCGAGCT TCCTCAGCGG ACCGAGGGCG GCGGCGGGCA TCGCGGCGAT CAACGCGATC 
GGCAATCTGG GCGGCTTCAT CGCCCAGAAC CTGGTGCCGA TGGTGCGCGA CGCGACAGGC 
AGCAACCTGG CGCCCATGCT CGCCCTGGCC GCCGTGCTGG TGGTGACCAG CATCCTGATC 
TTCTACGCCA TGGCCCGGCT GAACCGCGTG CGATCCAGCG CCGGGTGA

Protein sequence

MPDPSIDMAP DLERATVGRV TRRLMPLFCL MYLIAYIDRQ NVSYAKLDMV HALGLTEAAY 
GLGASLFFIG YFLFEAPSNL ILARVGARVW FARIMFTWGL VTLALGFTQN ATMFYVLRFL 
LGVTEAGFFP GVLYVLTLWY PQAHRGRMVG LFMIASAVAN AVGAVLGGLL LDLDGTLGLA 
GWQWVFLVTG VPAVLLAPYV LWRLPDGPTK ARWLPEAERA WLAKVLDTER GGVVDDHRGA 
WKAIFDPRVL LLAGLYIGMP LGAYGLSYWL PTIVKSFGVS NSVNGLINVI PWLLVAVALW 
FVPRHAARHG ASAWHIAGPC LLGALALVLS VIVPGSALKF AMLCLAAPAI FAAQPVFWSL 
PPSFLSGPRA AAGIAAINAI GNLGGFIAQN LVPMVRDATG SNLAPMLALA AVLVVTSILI 
FYAMARLNRV RSSAG