Gene Clim_0299 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0299
Symbol	nusA
ID	6353816
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	334432
End bp	335973
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	48%
IMG OID	642667928
Product	transcription elongation factor NusA
Protein accession	YP_001942372
Protein GI	189345843
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00000558254
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTAGAA AGCAGATAAA AGCGGAAGGG CAGGACAGGC GGGCGCAGAT AGCGAGCGCT 
TTCGGGGAAA TCGAGCAGTC GAAGATCTTT CTGGATAAAC GAACGGAGAG TGCGGCTGTA 
AAGATGGATA TAGCTGATCT TCTCAAGGAT ATTATTCAGA AACAGCTTCG CAAGGATTAT 
GATCCGGAAG TAGAGTCAAA TATTTTTATC AATCCGGAAC GAGGCGATTT TGAGGTCTAT 
ATTCTCAGAA AAATCGTTCA GGAGGTCGAT ATTCCCGCTA TTGAAATCAG TCTGGACGAG 
GTGAGAAAAA TCGATGAATC TCTTGATCTC GGCGATTTCT ACGAAGAGGG CCCGATCCGT 
CTCGAAGATT ATCTGACACG AAAATCTATT CAGATAATCA AACAGTCCGT ACAAAAGAAA 
GTCCGCGATC TTGAACGGCT TGTTGTGTAT GAAGAGTGCC TGGAAAAAGT CGGAGAGGTT 
GTTGCCGGAG AGGTTTACCA GATTCGTTCC AATGAGGTCA TCTTTACCTA TAATACCTCG 
AAGGATCATC GGGTTGAGCT GGTGCTGCCG AAATCGGAGA TGATGAAAAA AGACAATCCC 
CGCAGAACGC CAAGGATGAA ACTCTACGTC AAACGGATCG AACGGGAGAA AGCCAAGGTG 
CGGCTTGATG ACGGAGGCGT GGTTGAAAAG GAAAAACCCG ATGGCGGCAT GAAGGTTATC 
GTGTCACGAG TCGATGATCG TTTTCTCTAC AAGTTGTTTG AACACGAAGT CCCCGAAATA 
CTGGACGGTC TCATTGTTAT CAAGGGTATT GCCCGCGTTC CCGGAGAACG GGCGAAAGTT 
TCCGTCGAGT CGACCAGTGC ACGAATCGAT CCCGTAGGAG CGAGTGTCGG TTATCGCGGG 
AAACGTATTC AGAGTATAGT CAAGGAGCTC AATAACGAGA ATATCGACGT CATCTACTAT 
ACCGACGAAC CGCAGATATA CATTGCCAGA GCGCTGCAGC CGGCCAAGAT AGATCCGCTG 
ACGGTTCATG CCGATATAAA AACCCGCAAG GCAAGGGTTA TGCTCAAGCC CGATCAGATC 
AAGTATGCGA TCGGCAAGAA CGGCAATAAC ATCCATCTTG CAGAAAAGCT TACCGGTTAT 
GAAATCGATG TCTATCGTGA TGTGATCGAC AAATCACTGG AAGATCCGAC CGATATCGAC 
ATCATCGAGT TCCGTGAAGA GTTCGGCGAC GATATGCTCT ACCAGCTGCT CGATGCCGGT 
TTCGATACAG CTAAAAAAGT ACTGAAGGCG GGCATCGAAG AGATCGAACA AGCCCTTCTT 
GGCCCGGCAA AACCTGAGGA GGTTCTTATC TTCGGAAAAG GGCGTAAAGC TCCTTTCAAA 
CCGAGAGAAC GCAAGGTAAC GGATGAGGAA AAACGGTATT GGCGAAAGAT TGCTGAGAAC 
ATTTACCGGA CGGTCAAAGA GCAGTTCAGC GATTCGGATT TTCGTGACCT GATCGATGAT 
GCCGGTGACC GGGAAACGGT CAGTCTGAGT GCTGATGAAT GA

Protein sequence

MARKQIKAEG QDRRAQIASA FGEIEQSKIF LDKRTESAAV KMDIADLLKD IIQKQLRKDY 
DPEVESNIFI NPERGDFEVY ILRKIVQEVD IPAIEISLDE VRKIDESLDL GDFYEEGPIR 
LEDYLTRKSI QIIKQSVQKK VRDLERLVVY EECLEKVGEV VAGEVYQIRS NEVIFTYNTS 
KDHRVELVLP KSEMMKKDNP RRTPRMKLYV KRIEREKAKV RLDDGGVVEK EKPDGGMKVI 
VSRVDDRFLY KLFEHEVPEI LDGLIVIKGI ARVPGERAKV SVESTSARID PVGASVGYRG 
KRIQSIVKEL NNENIDVIYY TDEPQIYIAR ALQPAKIDPL TVHADIKTRK ARVMLKPDQI 
KYAIGKNGNN IHLAEKLTGY EIDVYRDVID KSLEDPTDID IIEFREEFGD DMLYQLLDAG 
FDTAKKVLKA GIEEIEQALL GPAKPEEVLI FGKGRKAPFK PRERKVTDEE KRYWRKIAEN 
IYRTVKEQFS DSDFRDLIDD AGDRETVSLS ADE