Gene Mlg_0757 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0757
Symbol
ID	4268570
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	840982
End bp	842391
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	71%
IMG OID	638125506
Product	rubredoxin-type Fe(Cys)4 protein
Protein accession	YP_741601
Protein GI	114319918
COG category	[C] Energy production and conversion
COG ID	[COG1251] NAD(P)H-nitrite reductase [COG1773] Rubredoxin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCAGAC CCTACCGACG CTACCTGTGC CGCGTCTGCG GTTATATCTA CGACGAGGCC 
AAGGGCGATC CTGACGGGAG TCTGCCTCCC GGCACCCGCT TCGAGGACAT CCCGGATGAC 
TGGGAATGCC CCGACTGCGG GATGCGCAAG GTCGAGTTGG ATCTCCTTGA GGAGGGCGAC 
GACGGCGGGG GCAGCCCCAA GATCCGCACG GGGTCGGCGC GCCCACAGGA TCCGGGGCCG 
GGTCAGGACC CGCACCCGGT GGTTATTGTC GGGGCCGGTA TGGCTGGTTG GGCGGTGGCG 
GAGGGGGTGC GGGCCCAGGA CGAGGGCCGC GCCATCACCC TCGTGACCCA ATGTAACGGG 
GACGTCTATT ACAAGCCCCA GCTGTCGGCG GCGGCCGCGC GTGGGCGGGG CCCGGATGAG 
CTCATTCAGG CGACCGGCGA GGACAAGGCC CGGGCCCTGG GGGTGAATCT GCTGGCCCGT 
ACCCGGGCGT TGCGCATCGA CACCGACCGG CGCCGCCTGA TCACGCCGCG TGGCGGTATC 
CCCTTCGGTG ACCTGGTCCT GGCCTGCGGC GCCCGCCAGC CCCGCCCGAG GCTGGCGGGG 
GACGCGGCCG GCGACGTGCT GCAGGTGAAC GACCTGGCCG ATTACCGGCG GCTCCGTGAA 
CGGGTGGATG TCCACGACTC GGCACGGGTC TTTATCCTCG GTGCCGGGCT GATTGGCTGC 
GAGTTCGCAG AGGACCTCTC CGGCGCCGGC CATGCGGTGA CTCTGGTGGA CATCGCCGAG 
CGGCCGCTGG CGCGGCTGCT GCCCGTGCCC CTGAGCGCGG ACCTGGCATT GGCGCTGGAT 
GACAAGGGCG TGGCGCTGCA CATGGGCCGG ACCGTGGACG CGGTGGACCG GGCCGCGGAT 
GGGGGCTATC GGGTGATGCT GGACGATGGT GGGGTCGTGG CCGCGGACGT GGTGGTCAGT 
GCCCTGGGCC TGATCCCAAA CACCTATCTG GCGACCCGGG CCGGGCTGTC GGTGGGGCAG 
GGGATCCAAG TGGACGGTCA ATTACGGACC AGCGACCCGG GGATACGGGC GCTGGGTGAC 
TGCAGCGAGC ACACCGGCCA CCTGCTGCCC TATGTGCAGC CGCTGAAGGC CCAGGCGCAG 
GTGATCGCCG CCTGCCTGGC AGGCGAGCGC GACCACTACA CCCCGGAGCC CGGCACGGTG 
CGCATCAAGA CGCCCTCCTG CCGGTTGGCG GTCTGGACGC CGTGGCAGGA GGGCGTCTGG 
CGCGAGGAGG CGCACGATGA GCAGGGCCGC ACCCTGGTGC ACTACAGCGG CGAGGCCGTC 
ACCGGCTTTG CCTTGTCCGG CCGCCATGTG CGCCAGGCCC CGAAGCTCGA GCGACAGGTT 
CAGGCCGGCC GCGACCGGGG TGTGGCCTGA

Protein sequence

MGRPYRRYLC RVCGYIYDEA KGDPDGSLPP GTRFEDIPDD WECPDCGMRK VELDLLEEGD 
DGGGSPKIRT GSARPQDPGP GQDPHPVVIV GAGMAGWAVA EGVRAQDEGR AITLVTQCNG 
DVYYKPQLSA AAARGRGPDE LIQATGEDKA RALGVNLLAR TRALRIDTDR RRLITPRGGI 
PFGDLVLACG ARQPRPRLAG DAAGDVLQVN DLADYRRLRE RVDVHDSARV FILGAGLIGC 
EFAEDLSGAG HAVTLVDIAE RPLARLLPVP LSADLALALD DKGVALHMGR TVDAVDRAAD 
GGYRVMLDDG GVVAADVVVS ALGLIPNTYL ATRAGLSVGQ GIQVDGQLRT SDPGIRALGD 
CSEHTGHLLP YVQPLKAQAQ VIAACLAGER DHYTPEPGTV RIKTPSCRLA VWTPWQEGVW 
REEAHDEQGR TLVHYSGEAV TGFALSGRHV RQAPKLERQV QAGRDRGVA