Gene Ent638_3606 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_3606
Symbol	nusA
ID	5111797
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	3910977
End bp	3912464
Gene Length	1488 bp
Protein Length	495 aa
Translation table	11
GC content	51%
IMG OID	640493810
Product	transcription elongation factor NusA
Protein accession	YP_001178315
Protein GI	146313241
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA [TIGR01954] transcription termination factor NusA, C-terminal duplication

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0209266
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0368341
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAAAG AAATTTTGGC TGTTGTTGAA GCCGTCTCTA ACGAGAAATC ACTGCCGCGT 
GAGAAGATTT TCGAAGCGCT GGAAAGTGCA CTGGCTACAG CAACCAAGAA AAAATACGAA 
CAAGAGATCG ATGTTCGCGT AGAAATCGAT CGTAAAAGCG GTGACTTCGA TACATTCCGT 
CGTTGGGTTA TTGTTGAAGA AGTGACCCAA CCGACTAAAG AAATTACGCT GGAAGCGGCT 
CGTTACGAAG ACGAAAGCTT CAATGTCGGC GAATATGTTG AAGATCAGAT TGAATCGGTG 
ACGTTTGACC GTATCACTAC CCAAACGGCG AAACAGGTTA TAGTACAGAA AGTACGTGAA 
GCTGAACGCG CCATGGTGGT TGATCAGTTC CGTTCACACG AAGGTGAAAT CATCACTGGC 
GTCGTGAAGA AAGTTAACCG TGACAACATC GCGCTTGACC TGGGTAGCAA CGCTGAAGCG 
GTTATCCTGC GCGAAGATAT GTTGCCGCGT GAGAACTTCC GTCCAGGCGA CCGCATCCGC 
GGTGTTCTGT ATGCGGTACG TCCAGAAGCG CGCGGTGCGC AGCTGTTCGT TACGCGTTCT 
AAAGCAGAGA TGCTGATTGA ACTGTTCCGC ATTGAAGTAC CAGAAATTGG TGAAGAACTT 
ATCGAGATCA AAGCAGCGGC CCGCGATCCG GGTTCACGCG CTAAGATCGC GGTAAAAACC 
AACGACAAGC GTATCGACCC GGTCGGTGCT TGCGTAGGTA TGCGTGGTGC GCGCGTTCAG 
GCGGTATCAA CTGAGCTGGG CGGCGAGCGT ATCGATATCA TCCTTTGGGA CGACAACCCG 
GCACAATTCG TGATTAACGC GATGGCTCCG GCAGATGTTG CTTCCATTGT GGTCGATGAA 
GACAAGCACA CCATGGATAT CGCTGTTGAA GCCGGTAACC TGGCGCAGGC TATCGGACGT 
AATGGTCAGA ACGTACGTTT GGCTTCTCAA CTGAGTGGTT GGGATCTGAA CGTGATGACC 
GTTGATGATC TGCAGGCGAA GCATCAGGCT GAAGCTCACG CCGCGATCGC AACCTTCACG 
AAGTACCTGG AAATTGACGA AGATTTCGCA ACTGTCCTGG TCGAAGAAGG TTTCTCTTCG 
CTTGAAGAAC TGGCCTATGT GCCAATTAAA GAACTGCTGG AAATTGACGG CCTGGATGAA 
GCAACCGTTG AAGCCCTGCG TGAACGCGCT AAAAACGCAC TGACCACCCT GGCACTGGCT 
CAGGAAGAAA GCCTTGGTGA TAACAAGCCG GCTGATGACC TGCTGAATTT AGAAGGTCTT 
GATCGTGCGA TTGCGTTCAA GCTGGCTGCC CATGGTGTTT GTACGCTGGA AGATCTCGCT 
GAGCAAGGCG TTGATGACCT GGCTGATATC GAAGGTTTAA CCGACGAGAA AGCCGGCGAA 
CTCATCATGG CCGCACGTAA TATTTGCTGG TTCGGCGACG AAGCGTAA

Protein sequence

MNKEILAVVE AVSNEKSLPR EKIFEALESA LATATKKKYE QEIDVRVEID RKSGDFDTFR 
RWVIVEEVTQ PTKEITLEAA RYEDESFNVG EYVEDQIESV TFDRITTQTA KQVIVQKVRE 
AERAMVVDQF RSHEGEIITG VVKKVNRDNI ALDLGSNAEA VILREDMLPR ENFRPGDRIR 
GVLYAVRPEA RGAQLFVTRS KAEMLIELFR IEVPEIGEEL IEIKAAARDP GSRAKIAVKT 
NDKRIDPVGA CVGMRGARVQ AVSTELGGER IDIILWDDNP AQFVINAMAP ADVASIVVDE 
DKHTMDIAVE AGNLAQAIGR NGQNVRLASQ LSGWDLNVMT VDDLQAKHQA EAHAAIATFT 
KYLEIDEDFA TVLVEEGFSS LEELAYVPIK ELLEIDGLDE ATVEALRERA KNALTTLALA 
QEESLGDNKP ADDLLNLEGL DRAIAFKLAA HGVCTLEDLA EQGVDDLADI EGLTDEKAGE 
LIMAARNICW FGDEA