Gene Athe_1049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1049
Symbol
ID	7409606
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	1143218
End bp	1144291
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	35%
IMG OID	643715415
Product	NusA antitermination factor
Protein accession	YP_002572923
Protein GI	222529041
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000259791
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCAAAA AAGAGCAAAC TCTTGATTTT CAGGAGCTGT TTTCGGCAAT TGATGAGCTT 
GAAAGAGAGT ATAAGATTGA AAAGGATTAT GTATACTCAG TTTTAGAATC AGCTCTTTTG 
ACAGCTTATA AGCAGGTAAA AGGAATAAAA GACAAAAATC TTTCTAACGT TAAAGTTTCC 
ATTGATCCAG AAAAGGGAAG TGTAAAAATT TATGAATACA GAAAAGTTGT CGAAAATGTA 
AAAGATAGAA AAAATGAAAT TTCACTTGAG GATGCACAAA AAATTGATAA GAGATATAAA 
ATTGGTGATA TTGTAGCAAT AGAGATTCCC ATTTCCCAGT TTAGCAGAAA GGCGGCAATG 
ACAGTCAGGC AGACAGTTAT AGGCAAGATA AGAGAAAAAA AGAGGAGCAT CATATTTGAA 
GATTATTCTT CAAAGATTGA TAATATAGTT ACAGGTATTA TACAGAGGAT TGATAAAAAG 
AATGTTATTG TAGAAATTGA AGGTGGGAAG GTTGAAGCAA TACTTCCAAT GGAGGAGCAA 
ATACCCGGTG AAGAGTACAA ACCAGGGACA TTGATGAAAT TTTATCTTGT TGATGTTAAA 
ATTCCTCCCA AAGAAAAAGA ACCTATTGTT TATCTTTCAA GAACTCATCC AAATTTAATA 
AAAAGGCTTA TGGAGAATGA AGTGCCTGAG ATACAAGAGG GTATAATTGA AATAAAAGCA 
ATTGCAAGAG AGGCAGGGTC AAGGTCAAAG GTAGCAGTTT ATTCTAACAG CTTAAAAGTT 
GATCCTGTTG GAGCTTGTAT AGGTGAAAAG GGGATACGAA TTCAGAATGT GCTAAAGCAT 
TTGAATGGTG AGAAAATTGA CATTGTAAAA TGGAGTAGTG ACATTGGGGA ATTTATAAAG 
AATGCACTCA GCCCTGCGGA GGTCGTCCAT ATTGATTTAA ATTTAATTGA AAAAAAGGCA 
TTTGTCCTTG TTCCAAACAG CCAATTGTCT CTTGCGATTG GCAAGGGTGG ACAAAACGCT 
CGGCTTGCAG CAAAACTTAC TGGTTGGAAA ATAGATATAA AGGGTAAAGA TTGA

Protein sequence

MPKKEQTLDF QELFSAIDEL EREYKIEKDY VYSVLESALL TAYKQVKGIK DKNLSNVKVS 
IDPEKGSVKI YEYRKVVENV KDRKNEISLE DAQKIDKRYK IGDIVAIEIP ISQFSRKAAM 
TVRQTVIGKI REKKRSIIFE DYSSKIDNIV TGIIQRIDKK NVIVEIEGGK VEAILPMEEQ 
IPGEEYKPGT LMKFYLVDVK IPPKEKEPIV YLSRTHPNLI KRLMENEVPE IQEGIIEIKA 
IAREAGSRSK VAVYSNSLKV DPVGACIGEK GIRIQNVLKH LNGEKIDIVK WSSDIGEFIK 
NALSPAEVVH IDLNLIEKKA FVLVPNSQLS LAIGKGGQNA RLAAKLTGWK IDIKGKD