Gene Mlg_0367 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0367
Symbol	rho
ID	4268958
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	413143
End bp	414399
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	63%
IMG OID	638125098
Product	transcription termination factor Rho
Protein accession	YP_741212
Protein GI	114319529
COG category	[K] Transcription
COG ID	[COG1158] Transcription termination factor
TIGRFAM ID	[TIGR00767] transcription termination factor Rho

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.151601
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCTGA CGGAACTAAA ACAGAAACCC GCCGCTGAAC TGATGAAACT GGCCCAGGAA 
CTGGGCGTGG AGGGGACGGC CCGCTCGCGC AAGCAGGACG TCATCTTTTC CATACTCAAG 
TCGCAGGCCA AAGGTGGCGA ACCCATCTAC GGCGATGGCG TGTTGGAGAT CCTGCAGGAT 
GGCTTCGGCT TTCTGAGGTC TGCCGACAGT TCATACATGG CGGGGCCGGA CGATATCTAC 
GTCTCGCCGA GCCAGATCCG GCGCTTCGCG CTGCGCACCG GCGACACCAT CGCGGGCAAG 
ATCCGCCCGC CCAAGGATGG TGAGCGCTAC TTCGCGCTGC TCAAGGTCAA TGAGATCAAC 
TTCGAGCCGC CGGAGAACGC CAAGCACAAG GTGCTGTTCG AGAACCTCAC GCCGCTGCAC 
GCCACCGAGC GTATGCGCAT GGAGCGCGGC AACGGCTCCA CGGAAGATCT CACCGCGCGG 
ATCATCGACC TGATCGCCCC CATCGGTAAG GGCCAGCGCG GCCTGCTGGT TTCGCCGCCC 
AAGGCGGGTA AGACGATGCT GCTGCAGCAC ATCGCGCAGA GCATCACCGC CAACCACCCC 
GAGACCTATC TGATCGTGCT GCTGATCGAC GAGCGCCCGG AGGAGGTCAC GGAGATGCAG 
CGCTCGGTGC GCGGCGAGGT GGTCTCCTCG ACCTTCGACG AGCCGGCCAG CCGCCACGTG 
CAGGTGGCGG AGATGGTGAT CGAGAAGGCC AAGCGGCTGG TGGAGCACAA GAAGGATGTG 
GTGATCCTGC TGGATTCCAT CACCCGTCTG GCCCGGGCCT ATAACACGGT GGTGCCTTCG 
TCGGGCAAGG TGCTGACCGG CGGTGTGGAC GCCAATGCCC TGCACCGGCC GAAGCGTTTC 
TTCGGTGCGG CGCGCAATGT GGAGGAAGGC GGCAGTCTGT CGATCATCGC CACGTCGCTG 
GTGGACACCG GCTCGCGGAT GGATGAGGTG ATTTACGAGG AGTTCAAGGG CACCGGCAAT 
ATGGAGCTGC ACTTGGACCG GCGCATCTCC GAGAAGCGGA TCTACCCGGC GGTGAACATC 
AACCGTTCGG GCACCCGCCG CGAGGAGTTG CTGATGAAGC CGGACGAGTT GCAGAAGGTG 
TGGATCCTGC GCAAGCTGCT GCACCCGATG GACGACCTGG CCGCCATCGA GTTCCTGCTG 
GACAAGCTGA AGGACACCAA GACCAACGGC GAGTTCTTTG ACTCGATGAA GCGGTGA

Protein sequence

MNLTELKQKP AAELMKLAQE LGVEGTARSR KQDVIFSILK SQAKGGEPIY GDGVLEILQD 
GFGFLRSADS SYMAGPDDIY VSPSQIRRFA LRTGDTIAGK IRPPKDGERY FALLKVNEIN 
FEPPENAKHK VLFENLTPLH ATERMRMERG NGSTEDLTAR IIDLIAPIGK GQRGLLVSPP 
KAGKTMLLQH IAQSITANHP ETYLIVLLID ERPEEVTEMQ RSVRGEVVSS TFDEPASRHV 
QVAEMVIEKA KRLVEHKKDV VILLDSITRL ARAYNTVVPS SGKVLTGGVD ANALHRPKRF 
FGAARNVEEG GSLSIIATSL VDTGSRMDEV IYEEFKGTGN MELHLDRRIS EKRIYPAVNI 
NRSGTRREEL LMKPDELQKV WILRKLLHPM DDLAAIEFLL DKLKDTKTNG EFFDSMKR