Gene Mlg_0334 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0334
Symbol
ID	4269897
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	378386
End bp	379504
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	67%
IMG OID	638125065
Product	AFG1 family ATPase
Protein accession	YP_741179
Protein GI	114319496
COG category	[R] General function prediction only
COG ID	[COG1485] Predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCCCC GCGAACGTTA CCAGCAGGAT CTGGATCAGG GCCTGATCAG CCCGGACGCC 
GCTCAGGCCG AGGCAGTCGA GGCCCTCCAG GCGCTCCACC AGGCGCTGAT CGACGCCCCG 
CCGCGGCCCC GGCCCGAACC CGCCGGCGGG GTCAGGGGGC TGCTTCGCCG GGTGCGGCGT 
GGGGCACCGG AGCCCGTGGA GCCGGTGACC GGGCTCTACC TTTGGGGCGG GGTGGGGCGC 
GGCAAGACCT ACCTGGTGGA CAGCTTCTTC GAGACCCTGC CCTTCGAGGA GAAGCGGCGG 
ATGCATTTCC ACCGTTTCAT GCACGCCGTC CACGACGAGC TCAAGGGGCT GCGCGACGAG 
CAGGATCCCC TGGAGCGGGT GGCGGATCGC TTCGCCGGAC GGGCCCGGGT GCTCTGTTTC 
GATGAGTTCT TCGTCAGCGA CATTGCCGAT GCGATGATTC TCGGCGGCTT GTTGCAGGCC 
CTCTTTGCCC GGGGCGTGAC CCTGGTGGCC ACCTCCAACA TCCCGCCGGA CGAGCTCTAC 
AAGGACGGGC TGCAGCGGGC CCGCTTCCTG CCCGCCATCG AACAGATCAA GCGCCACACC 
CGGGTCATGA ATGTGGATGG CGGCGTCGAC TACCGGTTGC GCTTTCTCGA GCGCGCGGAG 
ATCTACCATT GGCCGCTGGA TGCCGAGGCG GATGAGGTGC TCGCCGATGA CTTCGAGCAT 
GTGGCGCCGG AGCCCGGTAG CCGTGGTGAG TCACTGGAAG TGGAGGGGCG TTGGATCCCC 
ACCCGGCGGA TGGCGGACGG CGTGGTGTGG TTCGATTTCG CGGCGATCTG CGACGGCCCC 
CGAAGCCAAA CCGATTACAT CGAATTGGCG CGGACCTTTC ATACCGTGAT CATCTCCGGG 
GTGCCGGTGT TCGACCGTTT CCGGGACGAT CAGGCCCGCC GTTTCATAAG CCTGGTGGAC 
GAGTTCTACG ACCGGGGCGT CAAGCTCATC CTCTCCGCCG AGGCGCCGGC GGAGCGGCTC 
TATCAGGGCA AGCGGCTGAG TTTCGCCTTC GAGCGCACGG TCAGCCGGCT CCAGGAGATG 
CAGTCGCACG ACTATCTGGC GGCGCCGCAC CAACCCTGA

Protein sequence

MTPRERYQQD LDQGLISPDA AQAEAVEALQ ALHQALIDAP PRPRPEPAGG VRGLLRRVRR 
GAPEPVEPVT GLYLWGGVGR GKTYLVDSFF ETLPFEEKRR MHFHRFMHAV HDELKGLRDE 
QDPLERVADR FAGRARVLCF DEFFVSDIAD AMILGGLLQA LFARGVTLVA TSNIPPDELY 
KDGLQRARFL PAIEQIKRHT RVMNVDGGVD YRLRFLERAE IYHWPLDAEA DEVLADDFEH 
VAPEPGSRGE SLEVEGRWIP TRRMADGVVW FDFAAICDGP RSQTDYIELA RTFHTVIISG 
VPVFDRFRDD QARRFISLVD EFYDRGVKLI LSAEAPAERL YQGKRLSFAF ERTVSRLQEM 
QSHDYLAAPH QP