Gene Acel_2022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_2022
Symbol
ID	4486429
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	-
Start bp	2296342
End bp	2297436
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	69%
IMG OID	639730818
Product	NAD(P) transhydrogenase subunit alpha
Protein accession	YP_873780
Protein GI	117929229
COG category	[C] Energy production and conversion
COG ID	[COG3288] NAD/NADP transhydrogenase alpha subunit
TIGRFAM ID	[TIGR00561] NAD(P) transhydrogenase, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACATCG TCGCCGTCAG GGAGACTGCC CCCTACGAGC GTCGGGTCGC CGTCGTACCC 
GACACGGTGA CTCGACTTCG ATCCGCCGGA CACACCGTTG CCGTCGAACA GGGGGCCGGC 
GAGGCCGCCG GGTATCCCGA CGAGGTGTAC CGCGACGCGG GCGCACAGAT CGTGCAGCGG 
GAGGCATTGT CGGACGCAGA CGTCGTCCTT GCCGTGCAAC CGCTGCCAAC AGAAGATGCC 
CGGCGATTGC GGGCGGGCTG TCTTGTGCTG AGCTTCCTGC AACCGGCGGC GTACGCAGAG 
TTGCTTCACA TCCTCGCCGA GCGCAAGGCA AGCGCGATCT CCTTGGACCG CCTGCCGCGT 
ATCTCCCGGG CGCAGAGCAT GGATGCGCTC TCCTCGCAGG CGCTGGTCGC CGGCTACCGG 
GCGGCCCTCA TCGCAGCCGA GAAATTGCCG CGGTTCTTCC CCTTGCTCAT GACCGCCGCC 
GGGACGGTTC CGCCGGCAAA GGTCCTGGTT CTCGGCGCCG GGGTCGCCGG GCTGCAAGCG 
ATCGCCACGG CGCGTCGCCT CGGCGCAGTG GTCTCGGCGT ACGACGTCCG GGCCGCGGCG 
GCCGAGGAGG TGCGCAGTCT CGGGGCGACA TTCATCGATC TCGGCTTGGA AACGCTCGAG 
GGCGCCGGCG GTTACGCCCG GGAGATGACC GAGGAGCGGG CCGCCAAACA GCGGGAACTG 
CTCACCCCTC ATCTGGCCGC GTCGGACGCG GTCATCACGA CCGCGGCGGT TCCCGGCCGG 
CGGGCGCCTC TGCTCGTCGA CCGGCGCATG GTCGAGGCGA TGCGGCCCGG CACGGTCATT 
GTGGACATCG CGGCGGAATC CGGTGGGAAC GTCGAACTCT CCAAGCCGGG TGAAGAGGTT 
CTGCATAACG GCGTGCTCAT TTGGGGCGGC CGGAACGTGC CGAGCGGCAT GCCGTACGAC 
GCCAGTCGGC TCTACGCGCG GAATCTCGCG AATTTGCTCG TCATGCTGAC GCGGGACGGG 
GAGGTCGTCC TGGATCTCTC CGACGAGATC GTCGCAGCGT CGCTCGTCGT CCACGAAGGG 
CAGGTGCGGA CGTGA

Protein sequence

MNIVAVRETA PYERRVAVVP DTVTRLRSAG HTVAVEQGAG EAAGYPDEVY RDAGAQIVQR 
EALSDADVVL AVQPLPTEDA RRLRAGCLVL SFLQPAAYAE LLHILAERKA SAISLDRLPR 
ISRAQSMDAL SSQALVAGYR AALIAAEKLP RFFPLLMTAA GTVPPAKVLV LGAGVAGLQA 
IATARRLGAV VSAYDVRAAA AEEVRSLGAT FIDLGLETLE GAGGYAREMT EERAAKQREL 
LTPHLAASDA VITTAAVPGR RAPLLVDRRM VEAMRPGTVI VDIAAESGGN VELSKPGEEV 
LHNGVLIWGG RNVPSGMPYD ASRLYARNLA NLLVMLTRDG EVVLDLSDEI VAASLVVHEG 
QVRT