Gene Mlg_1075 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1075
Symbol
ID	4268997
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	1254735
End bp	1256063
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	56%
IMG OID	638125827
Product	periplasmic copper-binding
Protein accession	YP_741917
Protein GI	114320234
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3420] Nitrous oxidase accessory protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAATGA CCTTGAAATC CATCGTTACG CTGATGCTGT TGCTCACCCT CTCCCTGATG 
AAGGGGGCCT GGGCCGAGCC AACGTATGTG CAGCCCGGGG GTATGGGTCT GCAGGAGGCC 
ATTGATCAAG CCGAACCTGG CGATACGCTC TCGCTGCGAC CCGGGGTCTA TAGAGGCAAC 
TTCCGGATCG ATAAACCCTT GACCCTGAAG GGGGATAACG GGGCCATCCT GGATGGCCAA 
GGGGTCGGTG TCACCCTGTC CATTATTGGT GCACCAGATA CCCGTGTGGA GGGCCTGATC 
ATCCGCAACA GTGGCATCGA TATGACTGAA ATGGATGCTG CGATCTTTCT CGACAAGGGC 
TCCCACCGCA CAGTTATTAC AGGTAACCGG ATTCATTCCC GTGCCTTTGG GATATGGGCC 
GGGGAGAGCG ATGAGGTGCT GATTATCGCC AACCGGATCA GCGGTGATAC CCGTATGCGT 
TCGGCAGAGC GCGGCGATGG CATCCGCATG TTCCGGCTGA CAGACTCGGT CATCATCGCC 
AACGAGATCT GGGAAGCCCG CGACGGCATC TATATCGATG TCAGTCATCA CAACCGTCTG 
ATTGGCAACG TCCTGCATAA TCAGCGGTAT GGTATTCATT ACATGTTTTC CCACACCAAC 
GATGTGTTGG TGAACCGAAC CTATGATAAC CGCATGGGCT ACGCCCTGAT GATGTCCCGT 
CACCTCAATG TACAGGGGAA TACCTCTATC AGGGATCAGA ATTACGGGAT TCTTCTTAAT 
GCGGTCACTT ATTCCTATCT CGCAAGGAAC CGTTCTCTTG ACGTGATGCG GGGCCACCCG 
CCCGGTACGC CGGATGGGCA TGGCGTTCTT GGCGCCGAGG GCAAAGCCGT TTTTATTTAC 
AACTCGCAAC ACAACGAATT TGAAGACAAC CTGTTCGCCC GTGCGGAGAT CGGCGTCCAT 
CTGACAGCCG GCTCCAACAA CAACCACTTT CACGGCAATT CATTCGTCGG GAACCAGCAC 
CAGGTGATGT ACGTCGCGAA TGTGGAGCAG GAGTGGTCTC ACGAGGGGCG GGGTAACTAC 
TGGAGCGATT ACATGGGTTG GGATCTCAGG GGCGATGGCA TCGGTGATGT CCCGTATGAG 
CCCAACGATG CCATGGACGG CATCCTCTGG AAATACCCTG CCGCCAAGAT CCTTTTGAAC 
AGTCCTGCGG TGCAGGTCCT GCGCTGGGTT CAGCGGCAAT TCCCGGTGCT TCGCCCCAGT 
GGCGTGAAGG ACAGCTATCC GCTGATCAGG CCTGCGCATG ATTTGAAGCT CCTGGAGGAA 
CTCGGGTGA

Protein sequence

MRMTLKSIVT LMLLLTLSLM KGAWAEPTYV QPGGMGLQEA IDQAEPGDTL SLRPGVYRGN 
FRIDKPLTLK GDNGAILDGQ GVGVTLSIIG APDTRVEGLI IRNSGIDMTE MDAAIFLDKG 
SHRTVITGNR IHSRAFGIWA GESDEVLIIA NRISGDTRMR SAERGDGIRM FRLTDSVIIA 
NEIWEARDGI YIDVSHHNRL IGNVLHNQRY GIHYMFSHTN DVLVNRTYDN RMGYALMMSR 
HLNVQGNTSI RDQNYGILLN AVTYSYLARN RSLDVMRGHP PGTPDGHGVL GAEGKAVFIY 
NSQHNEFEDN LFARAEIGVH LTAGSNNNHF HGNSFVGNQH QVMYVANVEQ EWSHEGRGNY 
WSDYMGWDLR GDGIGDVPYE PNDAMDGILW KYPAAKILLN SPAVQVLRWV QRQFPVLRPS 
GVKDSYPLIR PAHDLKLLEE LG