Gene Athe_2103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2103
Symbol
ID	7408812
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	2228469
End bp	2229588
Gene Length	1120 bp
Protein Length	372 aa
Translation table	11
GC content	39%
IMG OID	643716469
Product	hypothetical protein
Protein accession	YP_002573952
Protein GI	222530070
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG1186] Protein chain release factor B
TIGRFAM ID	[TIGR00020] peptide chain release factor 2

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.117234
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTAATGC TTGAAGAAAT TTTGCAAAGA CTTGAAAAAG CAGAAGAAGA TTTAAAAGAA 
ATGAGGGTTT CTCTTTGACA TTGACGGGCT GGAAAGTGAA CTGAAATCCT TAGAGACTGA 
GACATCAAAA CCTGAGTTCT GGCAAGACAT AGAAAATTCC CAAAGAATTT TGCAGAAGAT 
AAAGAGAATA AAAGATAAAA TAGAAAGATT CCAAAAGTTA TATTCTCAAT GGGAGGATTT 
AAAAGTCTTG ACAGAGCTCA GTATAGAAGA AGGCAACCAC GAGATGTCAG AAGAACTTGA 
AAAAGAGCTC ATTAGCCTCG AAAGAAAAAT AGATGAATTT AAGATAGAAA TTCTTTTAAA 
CGGTCCATAT GACAAAAATA ATGCAATATT ATCAATCCAT GCTGGTGCAG GTGGCACAGA 
AGCTCAGGAC TGGGCAGAGA TGTTACTTAG GATGTACACG CGCTGGGCTG CAAAAAAAGG 
TTACAAGGTT GAAACTTTGG ACATTCTGCC CGGTGAAGAG GCAGGTATTA AAAATGTCAC 
CATTCGAATA GTTGGTGAAA ATGCTTATGG GTATTTAAAA GCTGAGAAAG GAGTTCACAG 
GCTTGTGAGG ATATCACCTT TTGATGCGGC TGGAAGAAGA CATACTTCCT TTGCAGCGGT 
TGAGGTTCTG CCCGAGGTTG AAGATGACAC CGACATTGAG ATAAAGGAAG AGGACCTTGA 
GATAGACACA TATAGATCAT CTGGTGCAGG TGGTCAGCAT GTTAACAAAA CAGAGTCAGC 
TGTCAGAATA AAGCATATTC CAACAGGTAT TGTTGTGACA TGCCAGAATG AGAGGTCTCA 
ACATAAAAAT AGAGAGATTG CTCTTAAAAT CTTAAAAGCA AAACTTTTAG AGCTTAAAGA 
AAAGGAAAGA AGAGAAAAGA TTCAAAAACT TAAAGGTGAA CAAACAGAGA TTGGCTGGGG 
CAACCAAATT AGGTCATATG TATTTTGTCC GTACACTTTG GTAAAAGACC ACAGGACAGA 
AGCTGAAGTA GGGAATGTTG AGGCAGTAAT GGACGGTGAG ATAGATGTCT TCATAAATGC 
GTACCTCAAG AAATTTAGAA ACGAGGAGGA TGTTGCGTGA

Protein sequence

MLMLEEILQR LEKAEEDLKE MGFLFDIDGL ESELKSLETE TSKPEFWQDI ENSQRILQKI 
KRIKDKIERF QKLYSQWEDL KVLTELSIEE GNHEMSEELE KELISLERKI DEFKIEILLN 
GPYDKNNAIL SIHAGAGGTE AQDWAEMLLR MYTRWAAKKG YKVETLDILP GEEAGIKNVT 
IRIVGENAYG YLKAEKGVHR LVRISPFDAA GRRHTSFAAV EVLPEVEDDT DIEIKEEDLE 
IDTYRSSGAG GQHVNKTESA VRIKHIPTGI VVTCQNERSQ HKNREIALKI LKAKLLELKE 
KERREKIQKL KGEQTEIGWG NQIRSYVFCP YTLVKDHRTE AEVGNVEAVM DGEIDVFINA 
YLKKFRNEED VA