Gene Acel_1043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_1043
Symbol
ID	4484520
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	-
Start bp	1149653
End bp	1151002
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	62%
IMG OID	639729818
Product	peptidase M24
Protein accession	YP_872802
Protein GI	117928251
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.127087
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.0673089
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCATTC GTACCTACGG TCCTAACGCC GTCGACTGGG AACAACGCAT CGACCTGGAT 
CGACTCCGCC GTGATCGACT CGCCCGACTC CGTGCCACCC TGGAGACGAC CGAACTCGGA 
GCACTCCTCG CCTTCGACTT CGCGAATATC CGATACATGA CGGCCACCCA CATCGGCACT 
TGGGCGGTCG ACAAACTCAT CCGATTCGCG TTACTGCCAC GCGGCGGAGA ACCGATCATC 
TGGGACTTCG GCTCCGCCGC CCGTCACCAC CAGCTCTTCA ACCCGTGGCT GGACGGGACA 
CGACGCGCAC GTGCGGGTAT TTCCACACTC CGCGGTGCTT TCCATCCGAA CGCCGGCATC 
GCGACCGAGC TTGCGCGCAA AATCGCCACC GAGCTTCGCG AGCACGGCCT CGCCAACGAG 
CCTCTCGGCG TGGATGTCAT CGAACTGCCG ATCCTTGCCG CTCTGCAAGC TGAAGGCGTG 
CAGGTCGTCG ACGGTCAACA GGTTTTCCTC GAAGCCCGGC GCATCAAGAC TCCCGACGAA 
ATCGCATTGC TCACACAAGC GTGCGCAATG GTCGATGCGG CATATGAAGA GCTGTATGCT 
TTTCTCCGTC CCGGCGTGCG TGAGAACGAA TGCGTCGGCG TGGTTAGCAA GGTTCTTTAC 
GACCTCGGCA GCGAATATGT CGAGGGAGTC AATGCCATCT CTGGGGAGCG CTGCTCCCCG 
CATCCGCACG TCTACAGCGA CAGAATCATC CGGCCGGGTG ATCCAGCGTT CTTCGACATC 
CTCCACAGCC ACCTCGGTTA CCGCACCTGC TACTACCGCA CCTTCGCAGT GGGCAGCGCC 
TCCCCTGCGA TGCGGGACGC CTACACACGA TGCCGGGAAT ACATGGACGC CGCGATTGCC 
ATGGTGAAGC CCGGAGTGAC CACGGCTGAC ATCGTGGCGC TGTGGCCGAA GGCTCAGGAA 
TTCGGATTCC CTGACGAGGA AGCCGCATTC GCGCTGCAAT ATGGTCACGG CGTCGGGCTC 
TCCATCTGGG AAAAGCCTAT CTTCAGTCGG CTCGTCTCTC TTGATCACCC GGAAACCCTG 
GAAGAGGGCA TGGTTTTCGC GCTCGAGACA TACTGGCCGG CGGCGGACGG TTGGTCCGCA 
GCCCGCATCG AAGAAGAAGT CGTCGTCACG GCCGACGGAT GCGAAGTCAT CACGAAGTTT 
CCAGCCGAGG ATCTCCTCGT GGCCGGCCGG CGGTATTGGA CCATCAATCA GCCTCTTCCC 
ACCCTCCGCG AGCCGGAATC CCATCGGAAC ACGCCTGCCG GACGTGGAGA AATGCGGCTT 
CCGCCGCAGC CTGACGCCCG CGGCAAGTGA

Protein sequence

MAIRTYGPNA VDWEQRIDLD RLRRDRLARL RATLETTELG ALLAFDFANI RYMTATHIGT 
WAVDKLIRFA LLPRGGEPII WDFGSAARHH QLFNPWLDGT RRARAGISTL RGAFHPNAGI 
ATELARKIAT ELREHGLANE PLGVDVIELP ILAALQAEGV QVVDGQQVFL EARRIKTPDE 
IALLTQACAM VDAAYEELYA FLRPGVRENE CVGVVSKVLY DLGSEYVEGV NAISGERCSP 
HPHVYSDRII RPGDPAFFDI LHSHLGYRTC YYRTFAVGSA SPAMRDAYTR CREYMDAAIA 
MVKPGVTTAD IVALWPKAQE FGFPDEEAAF ALQYGHGVGL SIWEKPIFSR LVSLDHPETL 
EEGMVFALET YWPAADGWSA ARIEEEVVVT ADGCEVITKF PAEDLLVAGR RYWTINQPLP 
TLREPESHRN TPAGRGEMRL PPQPDARGK