Gene Msil_3764 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3764
Symbol
ID	7090692
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	4119231
End bp	4120193
Gene Length	963 bp
Protein Length	320 aa
Translation table	11
GC content	63%
IMG OID	643467049
Product	NADH ubiquinone oxidoreductase 20 kDa subunit
Protein accession	YP_002364008
Protein GI	217979861
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA)

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAATC TGTTGTGGCT CCAGGGCGGA GCCTGTTCCG GCAACACGAT GTCGTTCCTG 
AACGCAGAGG AGCCGAGCGC CTGCGACCTA GTCACGGATT TCGGCGTCAA CGTCCTGTGG 
CATCCCTCCC TCGGCATGGA GCTCGGCGAC AATCTGAAGA AGCTGCTGCG GGCGCTGACC 
TCAGGCGAGA TCGCGCTCGA TATTTTTGTC TTCGAAGGCA CTGTGGTCAA CGCGCCGGAC 
GGCACAGGCG AATGGAACCG CTTCGCCGGA CGGCCCATGA AGGACTGGGT CGCCGACCTC 
GCCAAGGTCG CGAGCTTTAC GGTCGCGATC GGCGATTGCG CGACATGGGG CGGCATTCCG 
GCGACCGCGC CCAATCCGTC AGAGAGCCAG GGCCTGCAAT TTCTCAAGCG CGCCCATGGC 
GGCTTCCTCG GCAAGGACTA TAAATCCAAG GCCGGTCTGC CGGTCATCAA CATCCCTGGC 
TGCCCGGCGC ATCCCGACTG GATCACGCAG ATCGTCGTGG CGGTCGCCAC CGGCCGCGGC 
GGCGATTTGA CGCTCGACGA ATTTCAGCGT CCCAAAACTT TCTTCACCTC GTTCACCCAG 
ACCGGCTGCA CGCGCAACAT GCATTTCGCC TACAAGGTGT CGGCAACGGA ATTCGGCCAG 
CGCAAGGGTT GTCTCTTCTA CGATCTCGGC TGTCGTGGAC CGATGACCCA TTCGCCGTGC 
AATCGCATCC TGTGGAACAG GCAATCGTCG AAAACTCGCG CCGGCATGCC GTGCCTTGGC 
TGCACCGAGC CGGAGTTCCC CTTCTCCGAA CTCGCGCCCG GCACTGTGTT CAAGACGCAA 
ACGGTGATGG GCGTGCCAAA AGACATGCCG AGCGGCGTCG ACAAGACCGG CTACGTGAAG 
CTGACCGCGG CCGCCAAGGC CGCCTCGCCG CGCTGGGCCG AGGAAGACAT CTTCGTCGTC 
TGA

Protein sequence

MANLLWLQGG ACSGNTMSFL NAEEPSACDL VTDFGVNVLW HPSLGMELGD NLKKLLRALT 
SGEIALDIFV FEGTVVNAPD GTGEWNRFAG RPMKDWVADL AKVASFTVAI GDCATWGGIP 
ATAPNPSESQ GLQFLKRAHG GFLGKDYKSK AGLPVINIPG CPAHPDWITQ IVVAVATGRG 
GDLTLDEFQR PKTFFTSFTQ TGCTRNMHFA YKVSATEFGQ RKGCLFYDLG CRGPMTHSPC 
NRILWNRQSS KTRAGMPCLG CTEPEFPFSE LAPGTVFKTQ TVMGVPKDMP SGVDKTGYVK 
LTAAAKAASP RWAEEDIFVV