Gene DvMF_0491 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	DvMF_0491
Symbol	rho
ID	7172378
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris str. 'Miyazaki F'
Kingdom	Bacteria
Replicon accession	NC_011769
Strand	+
Start bp	575162
End bp	576412
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	63%
IMG OID	643538991
Product	transcription termination factor Rho
Protein accession	YP_002434916
Protein GI	218885595
COG category	[K] Transcription
COG ID	[COG1158] Transcription termination factor
TIGRFAM ID	[TIGR00767] transcription termination factor Rho

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	0.000212536
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATCTTT CGGAACTCAA GATCAAGAGC ATGAGCGAGC TCATGGAGCT TGCCGAGCAA 
TACAACGTCG AAGGCGCCAG CGGCATGCGC AAGCAGGAGC TGATCTTCGC CCTGCTCCAG 
GCCTGTGCCT CGCAGAACGG CGCCATCTAC GGCGACGGCG TGCTGGAGAT ACTGCCCGAC 
GGTTTCGGCT TTCTGCGGTC GCCGCTGTGC AGCTACATGC CCGGCCCCGA CGACATCTAT 
GTGTCGCCGT CGCAGATTCG CCGCTTCAAC CTGCGCAAGG GTGACGTTGT TTCCGGCCAG 
ATACGCCCGC CCAAGGAAGG CGAACGCTAC TTCGCCCTGC TGAAGGTGAC CGAGATCGGC 
TTCGAGCCGC CGGAAAACGC CAAGAATCTC GTCCTGTTCG ACAACCTGAC GCCCATCTAC 
CCCGACCGCC AGTTCATCAT GGAGAACGGG GACAAGAACT ACTCCAGCCG CGTCATAGAC 
ATGATGGCCC CCGTGGGCCG CGGCCAGCGC GGCCTGATCG TGGCGCCCCC CCGCACCGGC 
AAGACCATCC TGCTCCAGAC CATCGCCAAC TCCATCAACG CCAACCATCC GGATGCGTAC 
CTCATCGTGC TGCTCATCGA CGAGCGGCCC GAGGAAGTGA CCGACATGGA GCGCACGGTG 
AAGAACGCCG AAGTGGTCAG CTCCACCTTC GACGAGCCGC CGCAGCGCCA CGTGCAGGTC 
TGCGAAATGG TGCTGGAAAA GGCCAAGCGC CTGGTGGAAC GCAAGCGCGA CGTGGTCATC 
CTGCTCGACT CCATCACCCG CCTGGGCCGT GCGTACAACG CCGTCACCCC GTCCTCGGGC 
CGCGTGCTGT CCGGCGGTCT CGACGCCAAC GCCCTGCAAC GCCCCAAGCG CTTCTTCGGC 
GCGGCGCGCA ACATCGAGGA AGGCGGCAGC CTGACCATCA TCGCCACCGC CCTCATCGAC 
ACCGGCTCGC GCATGGACGA AGTGATCTTC GAAGAGTTCA AGGGCACCGG CAACATGGAA 
ATCTACCTGG AACGCCACCT TGCCGAAAAG CGCGTGTTCC CGGCTATCGA CATCAACCGC 
ACCGGCACCC GCAAGGAAGA CCTGCTACTG TCGGACGAGG TGCTCAACCG CGTGTGGATC 
CTGCGCAAGA TTCTGGCGCC CATGTCGCCC ATCGACAGCA TGGAATTCCT GCTGGACAAG 
ATGCGCGCCA CCAAGAGCAA CCGCGAATTC CTGAACGTGA TGAACAAGTA A

Protein sequence

MNLSELKIKS MSELMELAEQ YNVEGASGMR KQELIFALLQ ACASQNGAIY GDGVLEILPD 
GFGFLRSPLC SYMPGPDDIY VSPSQIRRFN LRKGDVVSGQ IRPPKEGERY FALLKVTEIG 
FEPPENAKNL VLFDNLTPIY PDRQFIMENG DKNYSSRVID MMAPVGRGQR GLIVAPPRTG 
KTILLQTIAN SINANHPDAY LIVLLIDERP EEVTDMERTV KNAEVVSSTF DEPPQRHVQV 
CEMVLEKAKR LVERKRDVVI LLDSITRLGR AYNAVTPSSG RVLSGGLDAN ALQRPKRFFG 
AARNIEEGGS LTIIATALID TGSRMDEVIF EEFKGTGNME IYLERHLAEK RVFPAIDINR 
TGTRKEDLLL SDEVLNRVWI LRKILAPMSP IDSMEFLLDK MRATKSNREF LNVMNK