Gene Athe_1241 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1241
Symbol
ID	7409715
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	1330191
End bp	1331381
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	29%
IMG OID	643715606
Product	hypothetical protein
Protein accession	YP_002573114
Protein GI	222529232
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACCGGC TGAACAGTTA CTTGAAAACC AATAAGTATG AATTTTTGGT TGCTGCAGGT 
GTTGCTACTA CTGTGCAGTT TGTTAGGTAT TCGTATATTC CTGTATATTT ATTTTTGTTG 
GCGTTATTTT TTATATCCTT TTATATCTAT AAACCAAAAA TAAGATTTGA TGCTTTGAAT 
TTTGTTCCTA TGTTTTTTTA TGTAAGCCTT GCATTGATTT CTCTCTTGTT ACTAAATGTA 
AGTTTAAACA AGGACAAGGC TATTATAGGT ATAATAAATG CTTTTGTATT CCCAGCATTG 
TTTTATGTCT TTCTCATTTC ATGTAACGGA AATTTTATTT TGAAAATAGA AAAAATATGG 
TTGTTTTTAT TAGCAATTGC TTCAGTTGTG TGTATTTTTG AATTTTTGTA CTATATAGCT 
TTCAAGAGTT TGAGAGAGAG AACTATTTCA ATCTTTTTTA ATCCAAACAC ATTTGCGTTT 
TTTTTAGTTA TGGTTTACCC ACTTGTGATA AACAAGTTGA AAGATGAAAA GTCAAAACTT 
TTGGTATCGT TCTTAATATT TATAGAAATC TTACTTTCTG GTTCAAGGAC AGGGTTTGTA 
GTATATATAT TCGAGTTTTT TCTTATAAAT ATTTACCTTA TTAGAAAAAA TATCTTAAAG 
GTTTTCTTGG CAGTAGCTGG TATATTGACT ATTTTCCTTC CTAAGATTCT CTATAGAATT 
CCAAGCTTAA GTGATGTAAC AAATCCTAAA ACGGCTGTTG GGCAGAGAGT TTTTGTGATT 
GAGTTTGTTT TGAGATATTT TTCACACAGA AGCCTGTTTG AAGGAATTGG CGCAGGTCAA 
TTTGAGCTAT TTTTTAGAAA GTTAAAAGCG CCTGGTTTAG TTGCCCTTCA CTCGGCACAT 
AATTTGTTTT TAAATGCCCT TATTGAATAT GGTATAATAG GATATATGAT TTTAGTTTTT 
ATAGTTTATT TTTCGGTTTT TCTTTCTGCA TATAATTTTT TTAAACACAA AGAAGAATAT 
GATAGAAATA TTTTTATTGG ATTTATTCTT ATAACCATTT TTCAGATGTT TGATATGGCT 
GAAATTACAA ATAGTAGGAT GCTATTAATT AACATGCTAT ATACATTTTA TCTTTTCTTG 
CCTATTTACA GATTTAAAAG GTGGAGAGCT ATAGATGGAA AATACTTTTA G

Protein sequence

MYRLNSYLKT NKYEFLVAAG VATTVQFVRY SYIPVYLFLL ALFFISFYIY KPKIRFDALN 
FVPMFFYVSL ALISLLLLNV SLNKDKAIIG IINAFVFPAL FYVFLISCNG NFILKIEKIW 
LFLLAIASVV CIFEFLYYIA FKSLRERTIS IFFNPNTFAF FLVMVYPLVI NKLKDEKSKL 
LVSFLIFIEI LLSGSRTGFV VYIFEFFLIN IYLIRKNILK VFLAVAGILT IFLPKILYRI 
PSLSDVTNPK TAVGQRVFVI EFVLRYFSHR SLFEGIGAGQ FELFFRKLKA PGLVALHSAH 
NLFLNALIEY GIIGYMILVF IVYFSVFLSA YNFFKHKEEY DRNIFIGFIL ITIFQMFDMA 
EITNSRMLLI NMLYTFYLFL PIYRFKRWRA IDGKYF