Gene Ent638_4003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_4003
Symbol	rho
ID	5110468
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	4340554
End bp	4341813
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	50%
IMG OID	640494221
Product	transcription termination factor Rho
Protein accession	YP_001178709
Protein GI	146313635
COG category	[K] Transcription
COG ID	[COG1158] Transcription termination factor
TIGRFAM ID	[TIGR00767] transcription termination factor Rho

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.499603
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.016258
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCTTA CCGAATTAAA GAATACGCCG GTTTCTGAGC TGATTACTCT CGGCGAAAAC 
ATGGGCCTTG AAAACCAGGC TCGTATGCGC AAGCAGGACA TCATTTTTGC CATCCTGAAG 
CAGCATGCTA AGAGTGGCGA AGATATCTTT GGCGACGGTG TACTGGAGAT ATTGCAAGAC 
GGATTTGGTT TCCTCCGTTC TGGAGACAGC TCCTACCTCG CCGGTCCTGA TGACATCTAC 
GTATCCCCTA GCCAAATCCG CCGTTTCAAC CTCCGTACTG GTGACACCAT TTCAGGTAAG 
ATTCGTCCTC CTAAAGAGGG TGAACGCTAC TTTGCGCTGT TGAAAGTTAA CGAAGTTAAC 
TACGATAAAC CTGAAAACTC GCGCAATAAG ATCCTGTTTG AAAACTTAAC GCCGCTGCAC 
GCGAACTCTC GCCTGCGCAT GGAGCGTGGT AACGGTTCTA CCGAAGACCT GACGGCTCGC 
GTTCTGGATC TGGCGTCTCC AATTGGTCGT GGTCAGCGTG GCCTGATCGT GGCACCACCG 
AAAGCAGGTA AGACCATGCT GCTGCAGAAC ATCGCGCAGA GCATTGCTTA CAACCATCCT 
GATTGCGTAC TGATGGTTCT GCTGATCGAT GAGCGTCCAG AAGAAGTAAC AGAGATGCAG 
CGTCTGGTGA AAGGTGAAGT GATTGCATCT ACCTTTGATG AGCCAGCCTC TCGCCACGTT 
CAGGTTGCTG AAATGGTTAT CGAGAAAGCT AAGCGTCTGG TCGAGCACAA GAAAGACGTT 
ATTATTCTGC TCGACTCCAT CACTCGTCTG GCGCGTGCTT ACAACACCGT AGTTCCTGCT 
TCCGGTAAAG TACTGACCGG TGGTGTGGAT GCGAACGCAT TACACCGTCC GAAGCGTTTC 
TTTGGTGCCG CGCGTAACGT TGAAGAGGGA GGAAGCCTGA CGATTATCGC AACCGCTCTG 
GTTGATACCG GCTCTAAAAT GGATGAAGTT ATCTACGAAG AGTTTAAAGG CACCGGTAAC 
ATGGAGCTGC ACCTGGCACG TAAAATCGCC GAGAAGCGCG TCTTCCCAGC GATTGATTAC 
AACCGTTCAG GGACGCGTAA AGAAGAGCTG CTCACCACTC AGGAAGAGCT GCAGAAAATG 
TGGATCCTGC GTAAGATCAT TCACCCGATG GGCGAAATCG ACGCAATGGA GTTCCTCATC 
AATAAGCTGG CAATGACAAA GACCAACGAT GATTTCTTCG ACATGATGAA ACGCTCGTAA

Protein sequence

MNLTELKNTP VSELITLGEN MGLENQARMR KQDIIFAILK QHAKSGEDIF GDGVLEILQD 
GFGFLRSGDS SYLAGPDDIY VSPSQIRRFN LRTGDTISGK IRPPKEGERY FALLKVNEVN 
YDKPENSRNK ILFENLTPLH ANSRLRMERG NGSTEDLTAR VLDLASPIGR GQRGLIVAPP 
KAGKTMLLQN IAQSIAYNHP DCVLMVLLID ERPEEVTEMQ RLVKGEVIAS TFDEPASRHV 
QVAEMVIEKA KRLVEHKKDV IILLDSITRL ARAYNTVVPA SGKVLTGGVD ANALHRPKRF 
FGAARNVEEG GSLTIIATAL VDTGSKMDEV IYEEFKGTGN MELHLARKIA EKRVFPAIDY 
NRSGTRKEEL LTTQEELQKM WILRKIIHPM GEIDAMEFLI NKLAMTKTND DFFDMMKRS