Gene Athe_1544 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_1544
Symbol
ID	7409052
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	-
Start bp	1633016
End bp	1634131
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	37%
IMG OID	643715916
Product	peptidase M29 aminopeptidase II
Protein accession	YP_002573415
Protein GI	222529533
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2309] Leucyl aminopeptidase (aminopeptidase T)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGACTGATG AGAGGTTGAA ACTTCTTGCA AAAAACCTTA TTGAGTATTC GGTTGAATTA 
AAAGAAGGCG AGAACATTTT AATTGAGCTT ATTGGACAGG AGATTGAACT TGCAAATCAA 
CTTGTAAAAC TTTCATATTT AAAAGGTGCA AAACCATTTT TGTGGCTAAA ACATCCAACA 
CTACTTAGAA CTCTTCTTTT GAGTGCAACA GAAGAGCAGA TAGAAATGAT CGCTCAAAAT 
GAAAGAGATC TTATGGAAAA GATGGATGCA TATATAGGTA TTAGATCTTC ACCAAATCCG 
TTTGAACTTT CAGATGTTCC AGACGAGAAG ATGAATCTGT ATCAAAGAAT ATGGTTTCAC 
AAAGTTCACG GAGAAGTCAG AGTTCCAAAG ACGAAATGGT GCATATTAAG ATACCCCAAC 
TATTCGATGG CACAACAGGC AAAGATGAGT TTGGAAGAGT TTGAAGATTT TTATTTTAAC 
GTTTGTAATC TTGACTATAG CAAAATGTCG AAAGCAATGG ATGCTTTGGT TGAGCTTATG 
CAAAACACAG ATGAGGTTCG GATAGTAGCA AAAGACACAG ATTTGAGATT TTCAATTAAA 
GGAATGAAAG CTGTCAAATG CGATGGCCAC ATGAACATTC CCGATGGTGA GGTATACACT 
GCACCTGTCA AGAATTCTGT AAATGGTTAT ATAACATACA ATACACCTTC GAACTATGCA 
GGGTTCAAGT TTGAAAATAT AAGATTTGAA TTTAAAGATG GAAAGATTGT AAAGGCAATT 
GCTAACAATA CAGAAAAGCT CAACAAGATA CTGGATACTG ACGAGGGTGC AAGGTATATT 
GGTGAATTTT CAATTGGTCT GAATCCATAT ATTACAAAGC CCATGGAAGA CACACTTTTC 
GATGAGAAGA TTGCTGGAAG CATCCATTTT ACCCCAGGTA GCGCATATGA GGATGCTGAC 
AATGGCAACA GATCAGCTGT GCATTGGGAC ATTGTACTCA TTCAAACACC TGAATATGGT 
GGTGGGGAAA TTTACTTTGA TGGAAAGCTC ATTAGAAAAG ATGGAAGATT TGTGATAAAA 
GATCTGGAAG GCTTAAACCC AGAGAACTTA AAATAG

Protein sequence

MTDERLKLLA KNLIEYSVEL KEGENILIEL IGQEIELANQ LVKLSYLKGA KPFLWLKHPT 
LLRTLLLSAT EEQIEMIAQN ERDLMEKMDA YIGIRSSPNP FELSDVPDEK MNLYQRIWFH 
KVHGEVRVPK TKWCILRYPN YSMAQQAKMS LEEFEDFYFN VCNLDYSKMS KAMDALVELM 
QNTDEVRIVA KDTDLRFSIK GMKAVKCDGH MNIPDGEVYT APVKNSVNGY ITYNTPSNYA 
GFKFENIRFE FKDGKIVKAI ANNTEKLNKI LDTDEGARYI GEFSIGLNPY ITKPMEDTLF 
DEKIAGSIHF TPGSAYEDAD NGNRSAVHWD IVLIQTPEYG GGEIYFDGKL IRKDGRFVIK 
DLEGLNPENL K