Gene Caul_0517 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0517
Symbol
ID	5897972
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	565552
End bp	566967
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	66%
IMG OID	641561000
Product	major facilitator transporter
Protein accession	YP_001682149
Protein GI	167644486
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2211] Na+/melibiose symporter and related transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCATCTA TCGAACGGGC GTCGACACTT TCGACGCCGA GGCTGTTTTC GTTTTCGACC 
ATCGCGCTGC CGCTTGGCGC GCTGGTGATC GCGATCAATG TCTATCTGCC TGCGCACCTG 
GCCAGTCATT TGGGCGTCAG CATGACCGTT GTCGGGTCGG CCTGGGCGGC TGTTCGCCTG 
ATCGATCTTG CGGTCGATCC GATGCTGGGC GTCCTCATGG ACCGCACGAA CACGCGCCTG 
GGGCGCTATC GCGCCTGGAT CTTGGTTGGC GGACCGATCC TGATGTTGGC GACTTGGGCG 
CTCTTCGAGG CGCCGCGTGA CATAGGACCG GTGTATCTGA TCGGATGGTT GCTCGCGCTC 
TATCTGGGGC AGTCGATCCT GACCATGGGG CAGTCGGCCT GGGCCGCGGG CCTGGCGCCC 
AGCTATGACG ACCGCTCGCG GGCTTTCGGG GCGATCTCGA TCGCAACGGT GACCGGAGGC 
ATCATGATCT TGATGGTGCC GTTGCTCGGC GCGCGGGTCG GTTGGTCGTC CGCCGCCGCG 
GCGCAGGCCA TGGGATGGTT CGTCGTCATC CTTGTCCCCA TCGTCGTGCT GACCGCAACG 
ACGCTCACCC CCGAGCGCCT GCCGGTCTTG CGAACCGAAG GTCTGCGGCT TCGCGATTTC 
GTGGGGCTGC TGACCAAGCC CGATCTCGTT CGCCTCTTCT TCGCGCAGCT CACATTGACC 
ATGGGGCCAG GCTGGATGAG CGCGCTCTAT CTGTTCTATT TCACCTCCGC GCGGGGCTTC 
TCGGCGCAGC AAGCGTCCCT CCTGCTGCTC TTCTACATCG TCGCGGGCGT GGTCGGCGCG 
ATCGTGATCG CGCGACTGGC GGTCGTTATC GGCAAGCACC GCGCCCTGAT CCTTGTCGCC 
CTGGTGTTCG CGGCGGACAT CTGCGCGACC AATTTCGCGC CCAAGGGCGA CCTCCTGCGG 
TCGGCGCCGC TGCTGGCGAT CGCCGGGTTC GCCGCCGCCG GCTTCGACCT GACGATCCGG 
GCGATGCTGG CCGATGTCGG CGACGAGGTG CGTCTTGAGC AGGGGCGCGA GCAACTCAGT 
CTGATCTATG CGTTGAATGC TTTGGCCAAC AAGCTGGCCT CGGCCTTCGC CATCGGCCTG 
ACCTTCCCGC TTCTCGCCTA TATTGGGTTC AATCCCGCCG ACGGCGCGGC GAACACGCCG 
CAGGCGGTCA GGGGCCTTGA ATTGGCCTAC GTGATCGGCC CCGTCGTCTT CGTCACCGTG 
GGCGCCTTTT GCCTGATCGG CTGGAAGCTC GACAGCCGCC GGCATGCCGC CATTCGGCGT 
CTCCTGGACG AGCATGACGC GCGCGCGGTG TTGGCCGATG TCAGCGAAAG CTTGCCGGCG 
GCGGAAGCCG GCGTGGCCCT GACTGTGGTC AAATAG

Protein sequence

MASIERASTL STPRLFSFST IALPLGALVI AINVYLPAHL ASHLGVSMTV VGSAWAAVRL 
IDLAVDPMLG VLMDRTNTRL GRYRAWILVG GPILMLATWA LFEAPRDIGP VYLIGWLLAL 
YLGQSILTMG QSAWAAGLAP SYDDRSRAFG AISIATVTGG IMILMVPLLG ARVGWSSAAA 
AQAMGWFVVI LVPIVVLTAT TLTPERLPVL RTEGLRLRDF VGLLTKPDLV RLFFAQLTLT 
MGPGWMSALY LFYFTSARGF SAQQASLLLL FYIVAGVVGA IVIARLAVVI GKHRALILVA 
LVFAADICAT NFAPKGDLLR SAPLLAIAGF AAAGFDLTIR AMLADVGDEV RLEQGREQLS 
LIYALNALAN KLASAFAIGL TFPLLAYIGF NPADGAANTP QAVRGLELAY VIGPVVFVTV 
GAFCLIGWKL DSRRHAAIRR LLDEHDARAV LADVSESLPA AEAGVALTVV K