Gene Emin_0666 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0666
Symbol
ID	6263129
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	740292
End bp	741683
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	42%
IMG OID	642611137
Product	NusA antitermination factor
Protein accession	YP_001875558
Protein GI	187251076
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA [TIGR01954] transcription termination factor NusA, C-terminal duplication

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.0123778
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAGGCA ATCCCAAAGA ATTAATGATG GCTCTAGAGA GCTTGGAAAG AGAAAAAAAT 
ATCAAAAGAG ACGATATTAT TAAAACAATA GAAGACGCCC TTGTGTCGGC GCTTCGCAAA 
AACTTAGGTA AAACAGCGCA AATAAGCGCG AAAATAAACC CCGAAGAGGG TGACATTAAG 
GCCTTTCAGG TTTTAAATAT TGTAGAAATT GTAGCAAACC CGGAAATGGA AATCTCACTT 
GAGCAAGCCA AAGCTATGGA TGACCGCTCC GAAGTAGGCG GCACAATAAC AAACGTTTTG 
GAAGTTGAGG ATTTTTCCCG TATAGCTGCG CAAATAGCCA AACAGGTTTT AATTCAAAAA 
GTAAGAGGTA TTGAAAGGGA AAATACTTAT AAAGAATTTA AACCCAGAGA GGGGGAAGTT 
ATTACAGGCT CCGTACGCAG ATTTTCCGAC AGGGATATTG TTGTTGATTT AGGCAAAGTT 
GAAGCTATTT TACCTTATTC CGAACAGATT AAAAGGGAAA GGTATTCTAA CGGATCGCGC 
ATTAAAGCTA TTATCACAAA AGTTTTATCC CAGCAGGACT TGCTTACAAT CGGCGAAGAT 
CCTGTTTTGG GCAGATACAA AAGCGCCGCT TTTAAAATGG ACAAAGGACA AAGAGGGCCA 
TACGTCATTT TATCGCGTAC AAGCCCAGCT TTTTTAGAAG ACTTATTTAA AGTTGAAGTT 
CCCGAAATAG GCGAAGGCAT TGTTGAAATC AAAGCTATTC AAAGAGACCC GGGCTTCAGA 
GCTAAAGTGG TTGTCAGAAG CTATGATAAT AAAGTTGACC CAATAGGCAC CTGCGTAGGC 
ATGAGGGGCA TAAGAATACG CGCTATTATG AATGAACTCA GCGGTGAACG TATTGACCTT 
ATTCCTTACA GCGAAGACGT TACAACAATG ATTATGAATT CAATAGCTCC GGCAAGAGCG 
AACTCCGTAA AAATAATAAG CGCCGAAGAG AAAAAAGCTC TTATCATTGT ACCTGACGAC 
CAGCTTGCCA TAGCTATAGG TAAAGACTGG CAGAATATTA AATTAGCCAG CAAACTTACA 
GGCTGGGAAC TTGAAGTAAA GAGCGAATCC CAAAAGCTCC AGGAGGGACA GGCCACCGTT 
GACAATCTTG AAAGCTTGTT AGCTTCCGTG GAAGGCATTG GGCCCAAAAC GGCCGAAACA 
CTTGTTAAAG CAGGCTTTTC TTCTGTTGAA AAGATAGCCG CTCTTGAGCC TGAACATCTT 
GCCACCGTGC AAGGTATCGG GGAAAAGAGC GCGGCCAAAA TTATTGAAGG GGCCAAAAAA 
TATTTAGAAA CGCAAGGCGA AGAGGTTTTG CAAGAGGAGG CAGTAAATGA CGACAACCAA 
GAAGGCAACT AA

Protein sequence

MEGNPKELMM ALESLEREKN IKRDDIIKTI EDALVSALRK NLGKTAQISA KINPEEGDIK 
AFQVLNIVEI VANPEMEISL EQAKAMDDRS EVGGTITNVL EVEDFSRIAA QIAKQVLIQK 
VRGIERENTY KEFKPREGEV ITGSVRRFSD RDIVVDLGKV EAILPYSEQI KRERYSNGSR 
IKAIITKVLS QQDLLTIGED PVLGRYKSAA FKMDKGQRGP YVILSRTSPA FLEDLFKVEV 
PEIGEGIVEI KAIQRDPGFR AKVVVRSYDN KVDPIGTCVG MRGIRIRAIM NELSGERIDL 
IPYSEDVTTM IMNSIAPARA NSVKIISAEE KKALIIVPDD QLAIAIGKDW QNIKLASKLT 
GWELEVKSES QKLQEGQATV DNLESLLASV EGIGPKTAET LVKAGFSSVE KIAALEPEHL 
ATVQGIGEKS AAKIIEGAKK YLETQGEEVL QEEAVNDDNQ EGN