Gene Jann_1946 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_1946
Symbol
ID	3934397
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	+
Start bp	1937312
End bp	1938661
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	61%
IMG OID	637904300
Product	extracellular solute-binding protein
Protein accession	YP_509888
Protein GI	89054437
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAGA TCTATCTGGC GAGCGCCGCC GCGCTCGCTC TCTCTGCCAG TGGCGCGCTT 
GCTGATGGCC ATATCAACCA CATTTTCCCC GTGGGTGAGG GCGAGTTCAA CTGGGACAGC 
TACACCGCCT ATGCCGATGC CTTTGACCTG TCCGGTCAGG AATTGACGAT GACGGGCCCG 
TGGACCGGCG ATGACGCGGA GCTTGTAAAC GCCGTTCTCG ACTATTTCGA AAGTGCGACC 
GGCGCGACGG TGCAATATTC CGGCTCCGAC AGCTTTGAAA CGGACATCGT CGTTGCGACG 
CAGGCGGGCT CTGCCCCCAA CATCGCGGTG TTCCCGCAGC CCGGCCTGAT GACAGACCTC 
GCATCGCGCG GGTTCCTGAC ACCTCTAGCG CCCGAGACCG CCGATTGGGT CCGTGAAAAC 
TATGCCGCAG GTGAATCCTG GGTGTCGCTT GGCACCGCAG CCAACGCCGC CGGTGAAGAG 
GCGCTGTACG GTTTCTTCTA CAAGGTCGAT CTGAAATCCC TGGTCTGGTA TTCGCCCGAG 
GCGTTTGACG AGGCGGGCTA TGACATCCCC GAGACGATGG AAGACCTGCT GGCGCTCAAC 
GATCAGATCG TCGAAGACGG CGCGACGCCA TGGTGTATCG GTCTGGGATC AGGTGGTGCC 
ACGGGCTGGC CCGCGACCGA CTGGGTCGAA GACATCATGC TGCGCACCCA ATCGCCCGAC 
GTCTATGACG CCTGGGTCGC CAACGAGATC CCCTTTGACG CGCCCGAAGT GGTCAACGCC 
ATCGAGACGT TCGGCGTCTT CGCCCGCAAC GGCGATTACG TGAATGGCGG TGTGGAGGCG 
GTGTCGTCCA CCGACTTCCG CGAAAGCCCC CTGGGCCTCT TCACCTTCCC GGCGGAATGC 
TACCTGCACC GTCAGGCGTC GTTCATCCCG ACATTCTTCC CCGAAGATGC GGATGTGGAC 
TTCTTCTACT TCCCCGCGTT TGAAGGCGAA GATCTGGGTT CGCCCGTCTT GGGCGCCGGC 
ACTCTGTTCG GCATCACCCA GGACAGCGAA GCGGCACAGG CATTCATGGC GTTCCTGCAA 
ACGGAAATCA GCCACGAGGT CTGGATGGCG CAGTCAGGCT TCCTGACACC GCATACCGGC 
GTGAATTCGG AGCTGTTCGC ATCCGACACG CTGCGCCAGA TGAACGACAT CCTGCTGGGG 
GCCACGACGT TCCGCTTTGA TGCCTCTGAC CTGATGCCGT CTGAAATCGG ACAGGGTATC 
TTCTGGTCCG GCATGGTCGA TTATGTGGGT GGCGAAGATG CCGCCTCCGT CGCGGCCCGG 
ATCCAGGACC GTTGGGCTGA AATCCAGTAA

Protein sequence

MKKIYLASAA ALALSASGAL ADGHINHIFP VGEGEFNWDS YTAYADAFDL SGQELTMTGP 
WTGDDAELVN AVLDYFESAT GATVQYSGSD SFETDIVVAT QAGSAPNIAV FPQPGLMTDL 
ASRGFLTPLA PETADWVREN YAAGESWVSL GTAANAAGEE ALYGFFYKVD LKSLVWYSPE 
AFDEAGYDIP ETMEDLLALN DQIVEDGATP WCIGLGSGGA TGWPATDWVE DIMLRTQSPD 
VYDAWVANEI PFDAPEVVNA IETFGVFARN GDYVNGGVEA VSSTDFRESP LGLFTFPAEC 
YLHRQASFIP TFFPEDADVD FFYFPAFEGE DLGSPVLGAG TLFGITQDSE AAQAFMAFLQ 
TEISHEVWMA QSGFLTPHTG VNSELFASDT LRQMNDILLG ATTFRFDASD LMPSEIGQGI 
FWSGMVDYVG GEDAASVAAR IQDRWAEIQ