Gene Mlg_0973 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0973
Symbol
ID	4270443
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	1109788
End bp	1111143
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	65%
IMG OID	638125724
Product	hypothetical protein
Protein accession	YP_741816
Protein GI	114320133
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0120678
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.0416317
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCGGG ACCCGCTGGA TCAGCCGGGG CTTCGGGCCC AGGCGCTGCC GCTGGGCGGC 
ACGCGGGAGC AAGTCGATTC CGGCACCGCG TTCAACCCGG CCCTCTCGGT GATCCTGGAC 
GGGGTGTACT ACTCCGAGTT CACCGGTGAG TGGGACGCCC CGGCGGGCTT TGACAGTGGC 
CACAGCCACA GCCACGGCCA CGGCCACGGC CACGGCCACG ACCATGACCT GGACGAGGGC 
TTCAACCTGC GCGAGACGGA GATCGCCTTC TCCGCGTCGG TGGACAACTA CTTCGACGCC 
ATGGTGATCC TGGCCATTGA GGGCGACTCC GGCATCGAGG TGGAAGAGGC CTATCTGACC 
ACCCAGAATT TGCCGGCGGG CCTGCAGGTG AAGGCCGGTA AGTTCCTGTC CGACATCGGC 
TACATCAACA AGCAGCACCC GCACGACTGG GACTTCGTCG ACCGTCCACT GGTCAACGAG 
TTCCTGTTCG GTGACCACGG CCTGCAGGAG AAGGGGGTGC AGCTCTCCTG GGTGCCAGCG 
ACTCCGGTCT ATACCCGATT CGGCGTCGAA CTCCTGCAGG GTGAGACCAG CGGGATCGCC 
AACTACATCG GTTCGGGCCG GGTAGAGGAA GTGACGGTGA CCCCCGATCC CGTCACCGGG 
GACCCCACCC GGCAGCGCTG GCGGGACGAC AACCCCTTCG ATGATGCCTC CGGACCCCGT 
CTCTTTACCG GCTTCTTCAA GATTGCGCCG GACCTCGGCT ACAACCACGC CGCCCAGTTC 
GGGCTTTCCT ACGGGATCGC CACCACCTTC CAGAATGAGC AGCAGCACTC CAGCACCCGG 
TACGAATCCT GGGACGGTGA TGCCTGGTTC GCCGGTGTGG ACGCCGTTTA TAAGTACGAC 
AGCGGTGGTG CCTACGGCCA CGGCAACCTG CGACTGCAGG GCGAGTACTT CCTGCGTGAG 
ATCGACGTCG ACTACATGAG TCAGAGCTTC CAGGGCGTCA ACAACGGCAG CCTGCAGACC 
ACCGACAGCT TCTCCGATCG CCGGCGCCAG GACGGCCTCT ACCTCCAGGC CGTCTACGGG 
TTCGCCCCGC GCTGGGAGGT CGGCGCCCGC TTCGAGGCCC TGGGCCTGAC CAACGAGTCG 
TTGGTGCCGG ACCGCAGCGC CGGTGAGTTC GAGGACTTCG ACGCCAGCTA CCGGTACACG 
CTCAACACCA CGTGGCGCCC GACCCACTTT TCCGCGCTGC GAGCTCAGCT CAACTACAAC 
GACTTCGCCA AGGAGGACGA CCACACCAAT CGCGGTGCCT CCTTCATGCT CCAGTACAAC 
CTGAGCCTGG GCGTGCACGG CGCACACCCC TTCTGA

Protein sequence

MQRDPLDQPG LRAQALPLGG TREQVDSGTA FNPALSVILD GVYYSEFTGE WDAPAGFDSG 
HSHSHGHGHG HGHDHDLDEG FNLRETEIAF SASVDNYFDA MVILAIEGDS GIEVEEAYLT 
TQNLPAGLQV KAGKFLSDIG YINKQHPHDW DFVDRPLVNE FLFGDHGLQE KGVQLSWVPA 
TPVYTRFGVE LLQGETSGIA NYIGSGRVEE VTVTPDPVTG DPTRQRWRDD NPFDDASGPR 
LFTGFFKIAP DLGYNHAAQF GLSYGIATTF QNEQQHSSTR YESWDGDAWF AGVDAVYKYD 
SGGAYGHGNL RLQGEYFLRE IDVDYMSQSF QGVNNGSLQT TDSFSDRRRQ DGLYLQAVYG 
FAPRWEVGAR FEALGLTNES LVPDRSAGEF EDFDASYRYT LNTTWRPTHF SALRAQLNYN 
DFAKEDDHTN RGASFMLQYN LSLGVHGAHP F