Gene Mlg_1600 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1600
Symbol
ID	4268298
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	1829514
End bp	1830734
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	75%
IMG OID	638126358
Product	hypothetical protein
Protein accession	YP_742437
Protein GI	114320754
COG category	[S] Function unknown
COG ID	[COG3597] Uncharacterized protein/domain associated with GTPases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.406561
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGGCC CCCGCCTTGC CCGCGCCTGG CAGCGCCTGA TCGATGCCGC GCTGCGCCCG 
GAGCGGGTCG GGGTGGACCA GGCGGAGCTG GCCCGGAAGG CGCGGGAGGC GGCGCCCGTG 
CTCTGGCTGG TGGGGAAGGT GCAATCGGGA AAGACCTCTC TGGTGCGCGC CCTCACCGGC 
GATCCGGCGG CCACGGTGGG CACCGGCTTC CAAAGCTGTA CCCGCTCGGC CCGGGTTTAC 
GACTTCCCCC CCGATGCCCC GCTGCTGCGG TTTCTCGATA GCCGGGGCCT GGGCGAGGCC 
GACTATGATC CGGCCGAGGA CCTCGCCGCC CTCAGCGGCC AGGCCCACGT GGTTCTGGCC 
GTTGCGCGCG CCATGGACCT GCAGCAGGAA GCGGTGCTCG AGCCTCTGCG TCAGGTGCGC 
CGTGCCCACC CCGACTGGCC GGTGCTACTG GTCCAGACCT GCCTCCATGA GGGCTATCCC 
GCCGGCCGCG ATCACCCACC CTACCCGGCG CTGGATCGGA CGCCCGGTCT GGAGGACCTA 
CAGCGGTGCC GGTACGAGCA GGCCCGCGCC TTTCAGGCCC TGCCCGGCCG GGGGCCGGTG 
GCGGTGGTGG CCGTGGACTT CACCCCGGCC GAGGAGGGTT TCGACCCGCC GCTCTACGGC 
CTGGAGGCGC TACTCGATGC CCTGGAGGCG CTCGCGCCGG AGGGGCTGGC GGCGATCCTT 
GCGGACCTGC GCCGCCCCGA CGACGACCCG CGGGTGCACC GGGCCCGGCC CCATATCCTC 
AGCTACGCCA GCGCCGCCGC GGCCGGCGAT GCCGTGCCGC TGTTGGGGTT GGTGTCGGTC 
CCGGTCCTGC AGGGCAAACT GCTGCACAGC CTTGGGCGGA TCTACGGGGT TCCCTGGGAC 
CGGCGCAGTC TCGGCGCCTT TCTCGCGGCC CTGGGCTCCG GGACGCTGGC CGGGCTGGGC 
CTGGGCCACG GCGCCCGGCA GCTCGGCAAG CTGGTACCGG GCTACGGGCA GACGGTGGGT 
GCCGCAGCGG CGGCCGCAAC CAGCTTCGCT GTCACCTATG CGCTGGGCCA CGCGGCGTGC 
CATTACCTGG CCCGGGCCGA GGCGGGCCGT GATCCCACCG CCGGCGTCGA GCAGGCCTAC 
CGCGAGGCGC TGCGCGATGC CTTCGGCCTG GTGCGCCGGC GGGCCGTCGC CTCCGCCCCC 
GGCACCGGGG AGGGGCCGTG A

Protein sequence

MTGPRLARAW QRLIDAALRP ERVGVDQAEL ARKAREAAPV LWLVGKVQSG KTSLVRALTG 
DPAATVGTGF QSCTRSARVY DFPPDAPLLR FLDSRGLGEA DYDPAEDLAA LSGQAHVVLA 
VARAMDLQQE AVLEPLRQVR RAHPDWPVLL VQTCLHEGYP AGRDHPPYPA LDRTPGLEDL 
QRCRYEQARA FQALPGRGPV AVVAVDFTPA EEGFDPPLYG LEALLDALEA LAPEGLAAIL 
ADLRRPDDDP RVHRARPHIL SYASAAAAGD AVPLLGLVSV PVLQGKLLHS LGRIYGVPWD 
RRSLGAFLAA LGSGTLAGLG LGHGARQLGK LVPGYGQTVG AAAAAATSFA VTYALGHAAC 
HYLARAEAGR DPTAGVEQAY REALRDAFGL VRRRAVASAP GTGEGP