Gene Mvan_3854 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_3854
Symbol
ID	4649171
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	4121967
End bp	4122827
Gene Length	861 bp
Protein Length	286 aa
Translation table	11
GC content	69%
IMG OID	639807320
Product	hypothetical protein
Protein accession	YP_954641
Protein GI	120404812
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID	[TIGR03620] probable F420-dependent oxidoreductase, MSMEG_4141 family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.357835
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.508421
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCTGT CCGGCGTCGG CCTGTGGAGT TCGCAACTGC GGTATGGAAA TCCGGACGAG 
GCGGCCGATG CCGCCGCCGA GCTCGACGGG CTCGGTTTCA CCGCCCTGTG GATTCCCGAT 
GTCGGCGGAC CGGTGCTGGA CTCCGTCGAC AACCTGCTGT CGGCGACCGA GAAGACCGTG 
ATCGCGACGG GGATCCTGAA CCTGTGGATG CACGAGCCCG CCGAGGTCGC CGCCCGCTAC 
GCAGCGTTGA CCGAGACCCA CGGCGAGCGG TTCCTGCTCG GCATCGGGGT CAGCCACGCG 
CCGTTGATCG ACTCGAACGA ACCGGGCCGC TACCGCAAGC CGCTGGCCGC CACCAAGGCG 
TTCCTCGACG GGATCGACGC GTCGCCGCAG CCGGTGCCGA CGGCCAACCG GGTGCTGGCC 
GCGCTCGGCC CCAAGATGTT GCAGCTGTCG GCGACGCGCG CCGGCGGTGC GCACCCGTAC 
CTGACCACCC CCGAGCACAC CCGCCAGGCC CGTGAGGTGC TCGGGTCAGG ACCGCTGCTG 
CTTCCCGAGC AGTCCGTACT GCTCACCGAC GACCGCGACC AGGCACGTGA GGTCGGAATC 
GATTGGCTGC GTTCGTATCT GGCGCTACCC AACTATGCCA ACAACCTGCT GCGCCTCGGG 
TTCAGCGAGG ATGACGTGTC GTCGGTCAGC GATCGGCTGT TCGACGCGCT GATCGCGTGG 
GGTGACGAAG ACGCCGTCCG GCGCCGGGTT CAGGAGCACC TCGACGCGGG CGCCGATCAC 
GTCTGCGTGC AGGTCCTCAC CGCGGATCCC CGCGAATTCC CCCGCGAGCA GTGGCGCAGG 
CTCGCCGAGG CTCTGCTGTA G

Protein sequence

MNLSGVGLWS SQLRYGNPDE AADAAAELDG LGFTALWIPD VGGPVLDSVD NLLSATEKTV 
IATGILNLWM HEPAEVAARY AALTETHGER FLLGIGVSHA PLIDSNEPGR YRKPLAATKA 
FLDGIDASPQ PVPTANRVLA ALGPKMLQLS ATRAGGAHPY LTTPEHTRQA REVLGSGPLL 
LPEQSVLLTD DRDQAREVGI DWLRSYLALP NYANNLLRLG FSEDDVSSVS DRLFDALIAW 
GDEDAVRRRV QEHLDAGADH VCVQVLTADP REFPREQWRR LAEALL