Gene Jann_2075 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_2075
Symbol
ID	3934528
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	+
Start bp	2082950
End bp	2084251
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	62%
IMG OID	637904431
Product	extracellular solute-binding protein
Protein accession	YP_510017
Protein GI	89054566
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.114781
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.235936
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCTTA AGAACACAAT CGGCGCAGGC CTTGCATTCG GCCTTTTGGC CGGAGCGGCT 
CAGGCGCAGA CCGAAATCGA ATGGTGGCAC GCGATGGGCG GCCAGCTGGG TGAGACCGTC 
AACCAGATGG CGGAAAACTT CAACGCGAGC CAGGGTGACT ATGTCATCAC GCCCGTCTTC 
AAAGGCACCT ATGAAGAGAC GCTGACCGCT GCCATCGCCG CCTTCCGCGC GGGCGAGCAG 
CCCAACATCG TGCAGGTCTT CGATGCGGGT GCCGCGACGG TCATCGGCGC ACAGGGCGCG 
ACCATCCCGG TGGAGCAGCT TTTGTCCGAG AACGGCGTTG ATTTCGACCG TGAGGATTAC 
ATCTCGGGCG TGCGCAACTT CTATGCCGAC GCCGATGGCC AGATGATCGG CATGCCGTTC 
AACTCCTCCA CGCCGATCAT GTACTACAAC GCCGATGCCC TGGAGGCCGC GGGTGTTGAG 
CCGCCCGCCA CCTGGGAAGA ATTTGCCGAA GTCACAGCGC CCGCGCTGGC GGAAGCGGGC 
TATGTGCCGC TGGCCCAGTC GCACCTGCCG TGGATCTTTA CCGAGAATTT CTTCTCGCGC 
CACAACCTGC AGTTCGCGTC CAACGACAAT GGCTACACCG GCACCGATAC CGAGATCATG 
GTCAACCACC CCGCCATCCG CGCGCATTTC ACCGCGCTGA CCGAATGGCA GGAGGCGGGC 
TATTTTGAAT GGTACGGCAC CGGTTGGGCC GACAACCAGG ACCCCTTTGA AGCGGGCGAA 
GTGGCCATGT GGCTCGGGTC TTCGGGCTCG TTCGGTGGCA TCGCCGACCG CGTTGACTTC 
AACTTCTCCG CCGCCATGCT GCCTTATTGG GAAGCCGTGA CGACCGAGCC CACGCAGACC 
TTCATCGGGG GCGCGGCTCT GTTCGCGATG TCCGGCTTTG ATGCGGAGCA GAATGAAGCC 
ACAGCGGCCT TCTTCGACTT CCTCGACAGC GTCGATGCGC AGGTCATGTG GCACACGGAA 
ACGGGCTATG TTCCGATCAC GACCGCCGCT TATGAAGCGA CGGCTGAGAC CGGTCACTAC 
GACACGTTCC CGGCAGCCGA AGTGGGTGTC CAGCAGCTGC AGCTGCCCGC TGGTGAGTTC 
ACCCGCGGCT ACCGCATGGG CTTCTACGTC CAGATCCGTG ACGTGATGAA CCGTGAGTAT 
GGCCGCATCC TGACCGGTGA AACCTCCGTC GATGACGCGT TCGAGACGAT CGAAGCGGAG 
GCCAACGAGC TTCTGTCGCG CTTCGCCCAG ACGCAGGGCT GA

Protein sequence

MNLKNTIGAG LAFGLLAGAA QAQTEIEWWH AMGGQLGETV NQMAENFNAS QGDYVITPVF 
KGTYEETLTA AIAAFRAGEQ PNIVQVFDAG AATVIGAQGA TIPVEQLLSE NGVDFDREDY 
ISGVRNFYAD ADGQMIGMPF NSSTPIMYYN ADALEAAGVE PPATWEEFAE VTAPALAEAG 
YVPLAQSHLP WIFTENFFSR HNLQFASNDN GYTGTDTEIM VNHPAIRAHF TALTEWQEAG 
YFEWYGTGWA DNQDPFEAGE VAMWLGSSGS FGGIADRVDF NFSAAMLPYW EAVTTEPTQT 
FIGGAALFAM SGFDAEQNEA TAAFFDFLDS VDAQVMWHTE TGYVPITTAA YEATAETGHY 
DTFPAAEVGV QQLQLPAGEF TRGYRMGFYV QIRDVMNREY GRILTGETSV DDAFETIEAE 
ANELLSRFAQ TQG