Gene Mext_2699 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_2699
Symbol
ID	5830946
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	3018753
End bp	3020390
Gene Length	1638 bp
Protein Length	545 aa
Translation table	11
GC content	68%
IMG OID	641368499
Product	transcription termination factor NusA
Protein accession	YP_001640161
Protein GI	163852118
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA [TIGR01954] transcription termination factor NusA, C-terminal duplication

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.311383
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.577361
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGTCG TCAGCGCCAA TCGGCTCGAA CTCCTGCAGA TCGCCGAGGC GGTCGCCCGC 
GAGAAGGTGA TCGACCGCCA GATCGTCATC GAGGCGATGG AAGAGGCGAT CGCGAAGGCG 
GCCCGCTCGC GCTACGGCGC CGAGACCGAC GTTCACGCCG AGATCGACAC GAAGAGCGGC 
GCGCTGCGCC TGTCCCGCCA CCTCCTCGTG GTCGATCAGG TTGAGAACGA CGCCCGTGAG 
ATCACCCTCG ATCAGGCCCG CCGCTACAAT CCCGGCGCCC TCATCGGCGA CGTGATCTCC 
GATACCCTGC CGCCGTTCGA TTTCGGCCGC GTCGCGGCGC AATCGGCCAA GCAGGTCATC 
GTCCAGAAGG TGCGCGACGC CGAGCGCGCC CGCCAGTACG ACGAGTACAA GGACCGGATC 
GGCGAGATCC TCAACGGCGT GGTCAAGCGC GTCGAGTACG GCAACGTCAT CGTCGATCTC 
GGCCGCGGCG AGGGCATCGT CCGCCGCGAC GAGATGATCC CGCGCGAGAC CTTCCGCCCC 
GGCGACCGTA TCCGCGCCTA CCTGTTCGAC GTGCGCTCCG AGGTGCGCGG GCCGCAGATC 
TTCCTGTCGC GCTCGCACCC GCAATTCATG GCCAAGCTGT TCGGCCAGGA AGTGCCGGAG 
ATCTATGACG GTATCGTCGA GGTGAAAGCG GTCGCCCGCG ATCCCGGCTC GCGCGCCAAG 
ATCGCGGTCA TCTCCCGCGA CTCCTCGATC GACCCGGTCG GCGCCTGCGT CGGTATGCGC 
GGATCCCGCG TCCAGGCGGT GGTCGGCGAG CTTCAGGGCG AGAAGATCGA CATCATTCCG 
TGGTCGGAAG ATCAGGCAAC CTTCATCGTC AACGCGCTGC AGCCGGCCGA GGTCGTGAAG 
GTGGTGCTCG ACGAGGAAGC CGACCGCATC GAGGTGGTGG TGCCCGACGA CCAGCTCTCG 
CTGGCCATCG GCCGCCGCGG CCAGAACGTG CGGCTGGCCT CGCAGCTCAC CGGCTGGGAC 
ATCGACATCC TGACCGAGGC CGAGGAATCC GAGCGGCGCC AGAAGGAGTT CGCGGAGCGG 
ACTCAGGCGT TCATGGAAGC GCTCGACGTG GACGAGACGG TTGGCCAGTT GCTGGCCGCC 
GAAGGCTTCC GCAACGTCGA GGAAATCGCC TTCGTCGATG TCGCCGAACT CTCCAACATC 
CAGGGCCTCG ACGAGGAGAC CGGTGCCGAG ATCCAGGCCC GCGCCCAGGA TTACCTCGCC 
CGGATCGAGC AGGAGCAGGA CGACCGCCGC CGCGAACTCG GCGTCGAGGA CGAACTGCGC 
GAGATCGACG GCATCACCAC CGCGATGATG GTGGCGCTGG GCGAGAACGA GGTGAAGACC 
GTCGAAGATC TCGCCGGCTG CGCCACCGAC GACCTCGTCG GCTACACCGA AGGCCGCGGC 
CCCGAGGCCG TGCGCCATGC CGGCTATCTC GACGGCTTCG AGCTGTCGCG GGCCGAGGCC 
GAGGCGCTGA TCATGGCCGC CCGTCTGAAG GCCGGCTGGA TCGACGCGCT GCCGGAGCCG 
GAGGGTGAAG CCGCCGAGGG CGACGCCCAG GACGGCGATG CGATCGAGGA AGCGACGGCC 
GAGCCGCAGC AGGCTTGA

Protein sequence

MAVVSANRLE LLQIAEAVAR EKVIDRQIVI EAMEEAIAKA ARSRYGAETD VHAEIDTKSG 
ALRLSRHLLV VDQVENDARE ITLDQARRYN PGALIGDVIS DTLPPFDFGR VAAQSAKQVI 
VQKVRDAERA RQYDEYKDRI GEILNGVVKR VEYGNVIVDL GRGEGIVRRD EMIPRETFRP 
GDRIRAYLFD VRSEVRGPQI FLSRSHPQFM AKLFGQEVPE IYDGIVEVKA VARDPGSRAK 
IAVISRDSSI DPVGACVGMR GSRVQAVVGE LQGEKIDIIP WSEDQATFIV NALQPAEVVK 
VVLDEEADRI EVVVPDDQLS LAIGRRGQNV RLASQLTGWD IDILTEAEES ERRQKEFAER 
TQAFMEALDV DETVGQLLAA EGFRNVEEIA FVDVAELSNI QGLDEETGAE IQARAQDYLA 
RIEQEQDDRR RELGVEDELR EIDGITTAMM VALGENEVKT VEDLAGCATD DLVGYTEGRG 
PEAVRHAGYL DGFELSRAEA EALIMAARLK AGWIDALPEP EGEAAEGDAQ DGDAIEEATA 
EPQQA