Gene Mlg_0797 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0797
Symbol
ID	4270561
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	889899
End bp	891380
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	69%
IMG OID	638125548
Product	hypothetical protein
Protein accession	YP_741641
Protein GI	114319958
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGCGG CGTCCCGGAC AATCCGGGGC CTCCTGTTGT TGCTTGCCGG CTTCGGCCTG 
CTGCCGGCGA CTACGTCGGC GCACTGGCTC CCGCAGAATG ACGCCCACCT GCGCCACGAT 
ATCCAAATCC TGGCGGATGC CGGGGTGATC ACCGGTGCGA TGGGCACATG GCCCGTGCCG 
CGCGAAGCCC TGCTCCCCAT CCTCCACCGG CCGTTGCCGG TCGAATCGCT GGATGCGCGT 
GAGGTTGCGG CCTGGTTCCG CGTGCGGCGG TTGTTGCGTG CAGAGCGGGG CTGGTACGGC 
AACCTGCGGG TGAAGGGCGT TGCCGGCGAG GCCGAGCCCC CCGCCGGGTT GGCTTGGTTC 
GGCAATGCCA ATCCGGAGGG CAGTGAGACC AGTGCGAGTG CCGCCTACCA AGGCGAAGGC 
CTGAGTTTCC GCCTGACCGG CAGTTGGGTG GACGACCCGG CGGATGGCCG CGAGTTCCGC 
GCCGACGGCA GCTACCTGGC GGCGCAGCTG GGCAACTGGA TTGTGTCGGC GGGTGCGGTG 
CCCACCTATT GGGGGCCGGG TTGGTCTGGC AGCCTGATTC TGGGTAACGC CGCCCGCCCG 
GTGCCGGGTC TCACGGTGCA GCGGGCGGAA CCGAAGGCGT TCCGGTTGCC GGTGCTCGAG 
CGCTTGGGCC CCTGGACCCT GCATGCCTTC TGGGGGCAGC TGGGGTCGGA TCGGGCAGTG 
CCCAGGCCCC ACTTCCTGGG CGCACGGTTC GCATTCCAGC CGAGCCCCCG GTTGGAGCTG 
GGGTTGAGTC GCACCGCTAT CTGGGACTCG CCCCACACTG CCCGCGGGCT TCTGGACCTG 
GCCATCGCAG ATCGGGACAG GGCCCAGCGC CGCACCACCG CCGAACAGAT GGCCGGTCTT 
GATCTGCGTC TGGCCTTTCC TGAGCATCTG TGGCCGTGGG CCGCGTATCT GCAGCACATC 
GGCGACAGTG AGTCCGGCCG GTTGCCCACC CAGCATATCG GTCTGTTCGG CCTGGAGAGT 
TGGGGGACGC TGGCCAATGA TGCCAGCTAC CGGGTGTTCC TGGAGTACGC CGATACCACG 
GCCCGCTTCT ATTCCAGCCG CAAGCTGTTC AACTCGGCCT ACGAGAGCGG TGGGCTGCCC 
AGCGGGCACC GGCACCGGGA CCGGCCATTG GGCTACGCCA CCGACAACGA CAGCCGCCTG 
TTGACCCTGG GCGCGCTGTA TCGGGCAGCG AACGATCACG CCGCCACGGT GAAGCTCCAG 
GTGGGCACTT TGAACCGCGA TGACAGTCAG CGGGCCGGTG CCGGAGGCAA CGTGATTGCG 
CCGCACAAAC TCCGACTGGT GGATTTGGAG GGGGGCTACC GCTGGCCGTT GCGTCACGGC 
GAGGCGGGCC TGGGCGCGGG GATGGCCCGG ATCGACGAAG CCCGTGAGGG TGGGGCGGAC 
TGGGAGGGGC GTGCCTGGCT GAAGTATGAG TACCAATTCT AG

Protein sequence

MTAASRTIRG LLLLLAGFGL LPATTSAHWL PQNDAHLRHD IQILADAGVI TGAMGTWPVP 
REALLPILHR PLPVESLDAR EVAAWFRVRR LLRAERGWYG NLRVKGVAGE AEPPAGLAWF 
GNANPEGSET SASAAYQGEG LSFRLTGSWV DDPADGREFR ADGSYLAAQL GNWIVSAGAV 
PTYWGPGWSG SLILGNAARP VPGLTVQRAE PKAFRLPVLE RLGPWTLHAF WGQLGSDRAV 
PRPHFLGARF AFQPSPRLEL GLSRTAIWDS PHTARGLLDL AIADRDRAQR RTTAEQMAGL 
DLRLAFPEHL WPWAAYLQHI GDSESGRLPT QHIGLFGLES WGTLANDASY RVFLEYADTT 
ARFYSSRKLF NSAYESGGLP SGHRHRDRPL GYATDNDSRL LTLGALYRAA NDHAATVKLQ 
VGTLNRDDSQ RAGAGGNVIA PHKLRLVDLE GGYRWPLRHG EAGLGAGMAR IDEAREGGAD 
WEGRAWLKYE YQF