Gene Jann_3935 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_3935
Symbol
ID	3936416
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	-
Start bp	4032565
End bp	4033827
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	63%
IMG OID	637906313
Product	extracellular solute-binding protein
Protein accession	YP_511877
Protein GI	89056426
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0774395
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.611638
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATGA TGAAAAAACT ATCTACGGGC GCAGCCGTGC TGGCCCTGTC AACGACGGCG 
ATCACGTCTG TTGCATCGGC ACAGGACGTG GAGGTTCTGC ACTGGTGGAC GTCCGGCGGC 
GAAGCGGCTG CCCTGAACGT GTTGCGCGAA GATCTTGCCG GGGGTGGCAT CGGTTGGACC 
GACATGCCAG TCGCTGGCGG CGGTGGCTCT GACGCCATGA CCGTCCTGCG CGCCCGCGTC 
ACCGCAGGCG ACCCGCCCAC CGCCGTGCAG ATGCTTGGCT TCTCGATTCA GGACTGGGCC 
GCCGAAGGCG CGCTGGCAGA CCTGAACGCG CTGGCGGAAG AGCAGAACTG GAATGAAGTG 
GTGCCGGAAG CGCTGCAAGC GTTCTCCACC TACGAGGGCA ACTGGGTTGC CGCGCCGGTT 
AACGTCCACT CCACCAACTG GGTCTGGGCC AACACCGCGC TGATGGAAGA GCTTGGTATC 
GAGCAGCCCG GCACTTGGGA AGAGTTCGTC GCCGCGATGG AAACGGCAGC AGAGGCGGGC 
TATACGCCGC TGGCCCACGG CGGTCAGGCT TGGCAGGACG CCACGATCTT CGACTCGATG 
GTGATGGGCG TTGGTGGACC CGAGTTCTAT CAGGCCTCCA TGGTCGATCT GGATCCTGAA 
GCCCTCGGCG GTGCGCAGAT GGTTGAAGCG TTTGACCGTA TGGCGACCCT GCGCGGCTTC 
GTGGATGACA ACTTCTCCGG TCGTGACTGG AACCTGGCCT CTGCCATGGT GATCAATGGC 
GAAGCGCTGT TCCAGATCAT GGGTGACTGG GCGAAGGGCG AATTCGTCAA TGCTGGCCTG 
ACGGCTGGCG ACGAATTCCA GTGCTTCCGC GTGCCCGGCA CCGAAGGCAC CGTGACCTTC 
AACTCCGACC AGTTCGCGAT GTTCGGCGTC GAGGACGAAG GCGATCAGGC GTCACAGGTT 
GCCATGGCCT CTGCCGTGAT GTCGCCTGAA TTCCAGATCG CGTTCAACGT GGTGAAGGGC 
TCTGCCCCTG CGCGCACCGA CATCGACGCA TCGTCCTTCG ACGCTTGTGG TCAGGCCGCC 
ATGGCGGATC TGGCGGCAGC CGGTGAAAGC GGTGGCCTGT TCGGCTCCAT GGCCCACGGC 
CACGCCAACC CGCCGTCGAT CCAGAACGCG ATGTACGACG TGATCACCGC CCACTTCAAC 
GGTGAGTTCG ACTCAGCAAC CGCCGCCGAA GAGATGGTCA CCGCCGTTGA GCTTGCTCAA 
TAA

Protein sequence

MTMMKKLSTG AAVLALSTTA ITSVASAQDV EVLHWWTSGG EAAALNVLRE DLAGGGIGWT 
DMPVAGGGGS DAMTVLRARV TAGDPPTAVQ MLGFSIQDWA AEGALADLNA LAEEQNWNEV 
VPEALQAFST YEGNWVAAPV NVHSTNWVWA NTALMEELGI EQPGTWEEFV AAMETAAEAG 
YTPLAHGGQA WQDATIFDSM VMGVGGPEFY QASMVDLDPE ALGGAQMVEA FDRMATLRGF 
VDDNFSGRDW NLASAMVING EALFQIMGDW AKGEFVNAGL TAGDEFQCFR VPGTEGTVTF 
NSDQFAMFGV EDEGDQASQV AMASAVMSPE FQIAFNVVKG SAPARTDIDA SSFDACGQAA 
MADLAAAGES GGLFGSMAHG HANPPSIQNA MYDVITAHFN GEFDSATAAE EMVTAVELAQ