Gene Caul_0227 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0227
Symbol
ID	5897501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	244486
End bp	245802
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	69%
IMG OID	641560711
Product	major facilitator transporter
Protein accession	YP_001681862
Protein GI	167644199
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.358089
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.545029
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACG GACAGACCCA GACCCCCGGC GCGCGCTATC GCTACGTCGT GCTGGCCATG 
CTGATCCTGG TCTACACGCT CAACTTCCTG GACCGGCAGA TCCTCGGCAT CCTGGCCAAG 
CCGATCAAGG AGGAGTTCGG GCTCACCGAC GGCCAGTTCG GCCTGATGAG CGGCCTGGCT 
TTCGCCCTGC TCTACACCAC CCTGGCCATC CCGATCGCCT GGCTGGCCGA CCGCTTCAGC 
CGGGTGTGGA TCATGACCAC GGCCCTGACC CTGTGGAGCG TCTTCACCGC CCTGTGCGGC 
TTCGCTGGCG GGTTCTCGGC GCTGTTCCTG GCCCGCATGG GCGTGGGGAT CGGCGAGGCG 
GGCGGGGTGG CGCCGGCCTA TTCGATGCTG GCGGACTATT TCCCCAAGCA TCAGAGGGCC 
CGGGCCTTGG CCGCCTACGC CTTCGGCATC CCGCTCGGCA CGGCGTCGGG CGCCCTGGTC 
GGCGGGCTGC TGGCCGTGCA CTTCGGCTGG CGGACGGCGT TCATCGCCGT TGGCCTGCTG 
GGCGTGGTCC TGGCCCCGAT CTTCCGCCTG GTGGTGCGCG ACCCGCGCCG GGGCGGCGCC 
GACATGGCGG TTGGCGACAC GACCTCGGTC CAGGCGCCGG CCGCGCCGCT CAAGGACGTG 
ATCCGCGTGC TGGCGAGGAA GCCCAGCTTC TGGCTGCTGT CGTTCGGGGC GGCCTCGTCC 
TCGGTGTGCG GCTATGGCGT GGCGTTGTGG TTGCCGTCGT TCTTCATGCG CAGCCTGGGC 
CTGACCCTGC GCGAGACGGC CTGGTACTAT TCGGGCATCG CCTTCTTCGG CGGGCTGATC 
GGCATCTGGC TGGGCGGGGC GGTGGCCGAC CGCCTGGGCG CCAAGTCCAA GGCGGCCTAT 
CCCCTGACCC CGGCCGTCGC CTTCCTGATC TCGGTGCCGT GCTTCCTGCT GGCCATGAAC 
AGCGGTTCGC TGGTCGGGAA CCTGGGCGGG GGCGCGGCCC TGGCCCTGGC CTTCGCGATC 
TTCCTGATCC CCACCGGGCT GAACCTGGCC TGGCTGGGGC CGATCACGGC GGCCGTGCAG 
CACCTGGCCC CCGCGCCGAT GCGCACCACG GCCTCGGCCC TGTTCCTGCT GATCAACAAC 
CTGCTGGGGA TCGCCGTCGG CACCTACTAT TTCGGCCTGG TTTCCGACCT CCTGAAGCCG 
GCTTTCGGCC AGGAATCCCT ACGCTGGTCG ATCTATACCG GCATGGGCTT CTATCTGGTC 
GCGGCGCTGC TGTTCTTCCT GGCCTCGCGT CGCCTGGCCA AGGACTGGGT GGACTAG

Protein sequence

MSDGQTQTPG ARYRYVVLAM LILVYTLNFL DRQILGILAK PIKEEFGLTD GQFGLMSGLA 
FALLYTTLAI PIAWLADRFS RVWIMTTALT LWSVFTALCG FAGGFSALFL ARMGVGIGEA 
GGVAPAYSML ADYFPKHQRA RALAAYAFGI PLGTASGALV GGLLAVHFGW RTAFIAVGLL 
GVVLAPIFRL VVRDPRRGGA DMAVGDTTSV QAPAAPLKDV IRVLARKPSF WLLSFGAASS 
SVCGYGVALW LPSFFMRSLG LTLRETAWYY SGIAFFGGLI GIWLGGAVAD RLGAKSKAAY 
PLTPAVAFLI SVPCFLLAMN SGSLVGNLGG GAALALAFAI FLIPTGLNLA WLGPITAAVQ 
HLAPAPMRTT ASALFLLINN LLGIAVGTYY FGLVSDLLKP AFGQESLRWS IYTGMGFYLV 
AALLFFLASR RLAKDWVD