Gene Jann_3944 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_3944
Symbol
ID	3936425
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	-
Start bp	4043650
End bp	4044918
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	64%
IMG OID	637906322
Product	extracellular solute-binding protein
Protein accession	YP_511886
Protein GI	89056435
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.282645
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAAAC TGCAAACCCT GCGGCTGACC TGTGCTGCGA CCGCTCTGAT GGCCGCGGGC 
ACCGCTCACG CCGATGAAGT GAGCTTCCTG TGCTATCAAA ACGGCAATGA ATGCGACGTG 
CTGGCGGCAA TTGCGGCGGA TTATGAGGCC GAAACCGGTC ACACCGTCGC CATGGAGGTC 
GTGGGCTATG AGATCGTCCG CGATCAGTTG GAAAACCAGC TGCAAACCGA TGCCGCGCCT 
GACGTGGCCC GCGTGACCAA TCTGGGCGGT TTGAACCAGT ATTACCTGGA CCTGACGCCC 
TATGTGGATG CCGATTACAT GGAAGCCGCC TATGGCGCGG TTCTGCCGTG GTATCGCGCG 
CCCGGCGGTG AAGACACGGG CATCTACGGC TGGCCGACCG AGCTGACCGT GACCGGCCCC 
TATATCAACG TCACCATGTT TGACGACGCG GGCGTCGAGA TCCCCGGCGA CGGGGCCACG 
TGGGATGAGT GGATGGTTGC GCTTGGCGAG GTTCAGGAAA CGCTTGGCAT GGACGCAGCC 
TTCGCGATGG ACCGCACCGC CCACCGTTGG GCCGGGCCTG CGTTCTCCTA TGGCGCTGCC 
TTCTTTGACG ATGCAGGCGC GCCGATCCTC GTGGACGAGG GCTTTACCAT CTACGCCGAG 
ACCTTCGTGG GTTGGCACGA GAGCGGGTTG ATGCCCGCCG ATGGCTGGCC CGCAGGCACC 
GGCACGGCCT ACCGCAACGC CGCGCCTCTG TTCCTGTCTG GATCGGTTGC CATGCATATG 
TCGGGATCCT GGATGATCGG CAACTACGCC GAAAACATCA CCGATTTTGA ATGGCGCGCC 
GTTCCCGCCC CCTGCGGTCC CGGCGGCTGT GGCGCAATGC CCGGCGGCGC TGGCATCGTG 
GCGTTCAACT CCACCGATGT GCCCGAGGCG GCAGCGGGCT TGATCGCCCA TTTCGCGTCC 
GAGGAAAACA CGGCACGCTT CGCGGCTGAG ACGTCCTCCA TCACCGCGCA TGCAGGCCTG 
CAAGCATCCG GGGTGGATTA CGGCGATGCG GATCCGGCGG TGGCGCAGGC CCTGTCGACC 
TTCGCGGCCT CCATCGGCAC AGCGGCAGAG ACGACACCTC AGGCCTTCAC CTTCCAGGGC 
TACGCCCAGA ACTTCGTGAT CTACGGCGTG GTGCCGGACT ACATCACGCA GGTCATCACC 
GGTGAATCCA CGCTGGAAGA TGCGTTGGCT GCCATCGACG CGGACGTCGC CGCACAGATC 
GCGGAATAA

Protein sequence

MTKLQTLRLT CAATALMAAG TAHADEVSFL CYQNGNECDV LAAIAADYEA ETGHTVAMEV 
VGYEIVRDQL ENQLQTDAAP DVARVTNLGG LNQYYLDLTP YVDADYMEAA YGAVLPWYRA 
PGGEDTGIYG WPTELTVTGP YINVTMFDDA GVEIPGDGAT WDEWMVALGE VQETLGMDAA 
FAMDRTAHRW AGPAFSYGAA FFDDAGAPIL VDEGFTIYAE TFVGWHESGL MPADGWPAGT 
GTAYRNAAPL FLSGSVAMHM SGSWMIGNYA ENITDFEWRA VPAPCGPGGC GAMPGGAGIV 
AFNSTDVPEA AAGLIAHFAS EENTARFAAE TSSITAHAGL QASGVDYGDA DPAVAQALST 
FAASIGTAAE TTPQAFTFQG YAQNFVIYGV VPDYITQVIT GESTLEDALA AIDADVAAQI 
AE