Gene Jann_1944 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_1944
Symbol
ID	3934395
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	-
Start bp	1934646
End bp	1935947
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	64%
IMG OID	637904298
Product	Beta-glucosidase
Protein accession	YP_509886
Protein GI	89054435
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID	[TIGR03356] beta-galactosidase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.781532
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTTCA AACGCTCCGA TTTCCCGGAG GGCTTTCGCT TCGGGGTCGC GACCTCCGCC 
TACCAGATCG AGGGGCACGC CCAGGGCGGC GCGGGCCTGA CCCATTGGGA CAGTTTTGCC 
GCCACGCCCG GCAATGTCGT GCGGTTTGAG GACGGCGCGC GGGCCTGCGA CCACCTGAAC 
CGGCTGGACG AGGATCTGGA CCTGATCCGC GATCTGGGCG CGGACGTCTA CCGGTTCTCC 
ACCTCCTGGG CGCGGGTGAT GCCGGAGGGG CGTGGAGCGG CCAACAAGGA CGGCCTCGAT 
TTCTACGATC GCCTCGTCGA TGGGCTGCTG GAGCGGGGCA TCGCGCCCGC CGTCACGCTC 
TATCACTGGG AATTGCCGCA GGCGCTGGCC GATAGGGGCG GCTGGCGCAA CGCCGACATG 
CCCGATTGGT TTGCCGACTA CACCGAGACC ATCATGTCCC GCATCGGCGA CCGCACCTGG 
TCCGCCGCTC CGATCAATGA GCCGTGGTGC GTCAGTTGGC TGTCGCATTT TGAGGGCCAC 
CACGCGCCGG GACTGCGTGA TATCCGCGCC ACCGCGCGGG CCATGCACCA CGTGCTGGTC 
AGCCACGGGC GGTCGATCCA GGTCATGAAA GGTCTGGGCG TGAAAAACCT CGGGGCCGTG 
TGCAATTTTG AATGGGCCAT GCCCAACACC GACAGCGATG CCGACATCGC CGCCGCCGCG 
CGCTATGACG CGATCTACAA CCGCTTCTTT CTGGGCGGGC TGTTCAAGGG CGACTACCCG 
GCAGAGGTGA TGGAGGGGTT GGAGCCCCAC CTGCCCGATG GCTGGCAGGA CGATTTCGCC 
ACCATCCGCT CACCGCTCGA TTGGGTGGGG GTGAATTACT ACACCAACAA ACGCATCAGC 
GCGACCGATG ACCCCTGGCC CGCCTATGCC TATGCGCCCA CCCAAGGCCC CCTGACCGAC 
ATGGGGTGGG AGGTCTACCC GCAGGGGTTG CAGGATTTTC TGACCCGCAC CGCCCGCGAA 
TACACTGGTG ATCTGCCGAT CTATGTCACC GAAAACGGCA TGGCGTCCGC CACCACGCCC 
GACCCCGACC GGATCGCCTA TCTGACCGAC CACCTGCACA GCGTTCAGGC CGCGATTGCC 
GACGGCGCCC CCGTTGCGGG CTATTACGTG TGGTCCCTGA TGGACAATTA TGAGTGGGCT 
TTGGGATACG AGAAACGCTT CGGCCTCGTC CATGTGGATT TTGAGACCTT GGCACGGACG 
CCCAAAGCGT CCTATCACGC ATTAGCAAAT TGGTGGCGCT GA

Protein sequence

MDFKRSDFPE GFRFGVATSA YQIEGHAQGG AGLTHWDSFA ATPGNVVRFE DGARACDHLN 
RLDEDLDLIR DLGADVYRFS TSWARVMPEG RGAANKDGLD FYDRLVDGLL ERGIAPAVTL 
YHWELPQALA DRGGWRNADM PDWFADYTET IMSRIGDRTW SAAPINEPWC VSWLSHFEGH 
HAPGLRDIRA TARAMHHVLV SHGRSIQVMK GLGVKNLGAV CNFEWAMPNT DSDADIAAAA 
RYDAIYNRFF LGGLFKGDYP AEVMEGLEPH LPDGWQDDFA TIRSPLDWVG VNYYTNKRIS 
ATDDPWPAYA YAPTQGPLTD MGWEVYPQGL QDFLTRTARE YTGDLPIYVT ENGMASATTP 
DPDRIAYLTD HLHSVQAAIA DGAPVAGYYV WSLMDNYEWA LGYEKRFGLV HVDFETLART 
PKASYHALAN WWR