Gene Anae109_1139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_1139
Symbol
ID	5377445
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	+
Start bp	1290733
End bp	1292403
Gene Length	1671 bp
Protein Length	556 aa
Translation table	11
GC content	70%
IMG OID	640842647
Product	NusA antitermination factor
Protein accession	YP_001378331
Protein GI	153004006
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.0315403
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCAGA ACGTGAACCT GAACCTCATC CTCGACCAGG TCGCCAAGGA CAAGGGCATC 
GACCGCACGC GCCTCGTCGA GATCCTCGAG GAGGCGATCG GCAGCGCCGC GAAGCGCCAC 
TTCGGGATGG AGCGGAACCT GAAGGCCCGC TACGACGAGG AGAAGGGCCA GGTCGATCTC 
TTCCAGGTCC TCACCATCGT CACGGACCCG ACCGAGGAGA CCCCCCTCGC CGACCCGGTG 
AACATGATCC CGGTGTCGGT CGCGCACGAG AAGGGCATCG AGGTGGAGCC GGGCGACGAG 
CTCGACTTCC CCATCTACTA CCGCACCGAG GACGAGGCGG AGGCGCGCGC CCAGGACGAG 
CAGTGGGGCG ACCTGCTCAA GCTGAAGACC TACCGCCGCT CCTTCGGCCG CATCGCGGCG 
CAGACCGCGA AGCAGGTGAT GATCCAGGGC ACCCGCAACG CCGAGCGCGA GAACGTCTTC 
AACGAGTACA AGGACCGCAA GGGCGAGGTC ATCACCGGCA TCGTGCGGCG CTTCGAGCGC 
GGTAACGTCA TCGTCGACCT CGGCCGCGCC GAGGCGGTGC TGCCGGTGCG CGAGCAGGTG 
CCGCGGGAGA GCTACCGGGC CGGCGACCGG ATCCAGGCCT ACGTGATGGA CGTGCTGCGC 
GAGTCCAAGG GGCCGCAGAT CATCCTCTCG CGCGCGTCCG TCGATCTCCT CCGGAAGCTC 
TTCGAGATGG AGGTGCCGGA GATCGCCGAG GGGGTGGTGG TGATCGAGGC CGCGGCCCGC 
GAGCCGGGCG GGCGGGCGAA GATCGCGGTC TCCTCGCGCG ACTCGGACGT GGATCCCGTC 
GGCGCCTGCG TCGGCATGAA GGGCAGCCGG GTCCAGGCGG TCGTGCAGGA GCTCCGCGGC 
GAGAAGATCG ACATCGTGCC GTGGGACGAC GACTACGCCC GCTTCGTGTG CAACGCGCTC 
GCGCCGGCCG AGGTCTCCCG CGTCCTCCTC GACGAGCAGA ACAAGGCGAT GGAGATCATC 
GTCCCCGACG ACCAGCTCTC GCTCGCCATC GGGCGCCGCG GCCAGAACGT GCGGCTCGCC 
TCGCAGCTCA CCGGCTGGAA GCTCGACATC AACTCCGAGT CGCGCGTGAA GGAGATGCGC 
GAGTTCGCGA CCGAGAGCTT CGGCGCCATC GGCATCCCCG AGGCCACGCA GGAGATGCTG 
TACGCGCACG GCTTCCGCAA GGCGCAGGAC GTGGCGAACG CCGCCTCCGA GATGCTCACC 
CAGTTCCCGG GCTTCACGAT GGACATGATC CCGGAGCTGC AGAAGCGCGC CCGCGAGCAG 
TCGATCGTCG ACGCGGAGAA GGAGATGCGG CTCGAGCAGG AGCGCGAGGC CGCCCGCATC 
GCCGAGGCGC GGCGCCACCC CGACGAGCTC ACGCAGGAGG AGCGCTTCGC GCGCGTCCGC 
GGCGTCGGCG AGAAGACCAT CGAGCAGCTG AAGGTCGCCG GCTACGGCAG CGTCGAGGCC 
GTCCACAACG AGTCGGACGT GATGCGGCTC GCCGAGTCGA GCGGGCTCGG CATCAAGAAG 
GCCCGCCAGC TCAAGCACGC GGTGGGCGTC TACCTCGAGG AGGAGGTCAA GCTCCGCGCC 
GAGCTCGACG CCGAGCGGGC GAAGGCCGCG CAGGGGGGCG CCGGCGCTTG A

Protein sequence

MQQNVNLNLI LDQVAKDKGI DRTRLVEILE EAIGSAAKRH FGMERNLKAR YDEEKGQVDL 
FQVLTIVTDP TEETPLADPV NMIPVSVAHE KGIEVEPGDE LDFPIYYRTE DEAEARAQDE 
QWGDLLKLKT YRRSFGRIAA QTAKQVMIQG TRNAERENVF NEYKDRKGEV ITGIVRRFER 
GNVIVDLGRA EAVLPVREQV PRESYRAGDR IQAYVMDVLR ESKGPQIILS RASVDLLRKL 
FEMEVPEIAE GVVVIEAAAR EPGGRAKIAV SSRDSDVDPV GACVGMKGSR VQAVVQELRG 
EKIDIVPWDD DYARFVCNAL APAEVSRVLL DEQNKAMEII VPDDQLSLAI GRRGQNVRLA 
SQLTGWKLDI NSESRVKEMR EFATESFGAI GIPEATQEML YAHGFRKAQD VANAASEMLT 
QFPGFTMDMI PELQKRAREQ SIVDAEKEMR LEQEREAARI AEARRHPDEL TQEERFARVR 
GVGEKTIEQL KVAGYGSVEA VHNESDVMRL AESSGLGIKK ARQLKHAVGV YLEEEVKLRA 
ELDAERAKAA QGGAGA