Gene Tneu_0421 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tneu_0421
Symbol
ID	6166206
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermoproteus neutrophilus V24Sta
Kingdom	Archaea
Replicon accession	NC_010525
Strand	-
Start bp	379540
End bp	380949
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	63%
IMG OID	641667579
Product	aldehyde dehydrogenase
Protein accession	YP_001793815
Protein GI	171184896
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.96029
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0394656
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAACC TAGTGGTGGT TAATCCAGCC ACCGAGGAGG CAATCGCCGA GCTCCCACAA 
GCCACGAGAG AAGACGTGAG GAGGGCCATA GACGCCGCGT GGGACGCCTT CGCCAGCTGG 
TCGGCTCTCC CCCTGAGGAA GAGGACCCGC GTCTTGCTGA AGACCGCCGA GCTTGCCGAG 
GCCGCCAGGG AGGACCTCCT CAAGACGCTG GTGGCGGAGT CAGGAAAGCC CATCAGAGAT 
GCGGAGGCGG AGATCACGAG GGCGATAGAC ATCTTCCGCT CCAGCGCGGA GGAGGCCAAA 
CTGATCCTGG AGGGGTCCGC CCCCAGGGTA GACGCCTACG AGTACCCAAT CGGCAACGAA 
AACAGGCTCG TGGTGGCCGT GAGGGAGCCC GTGGGCGTCG TCGGGGGGGC CCTCAGCTAC 
AACAACCCCG CCTCCACCTT CGCCCACAAG GTGGCCCCCG TCATCGCGGC GGGGAACACA 
GTCGTCGTGA AGCCCTCCTC CTACACCCCC CTCACCGCCC TCAAGTTCCT GGAGATTATG 
AAGAGGGCTG GGGTGCCCGA GGGGGTGGTA AACGTGGTTG TGGGCAGCGG GGAGGAGGTC 
TTCGACGAGC TTATCCAGAG CGACAAGGTC GCTGGGATAA ACTTCACCGG TAGCACAGCG 
GTAGGGCTAC AGGTGGCGGC TAAGGCCGCC TCCAGGGGGA AGAAGTTCAT GATAGCGCCA 
GGGGGCTCCG ACCCGGCCGT GGTGTTTAAA GACGCCGATT TAGACGCGGC GGCTAGGATC 
GTCGCCAGAG CCCGGTACGA AAACGCGGGC CAGAACTGCA ACGCCACCAA GAGGGTTTTC 
GTGGAGCGGG AGGTCTACCC CAGGTTCGTG GAGCTCCTCC TCGGCTATGT GAAAGCCATA 
AGGGTGGGCG ACCCCATGGA CTACAGCACG GACATGGGGC CCCTCATCTC CGAGAAGATA 
GTGAAGGCCA TGGACGGCGT AGTGAAAGAC GCCCTTGAGA AAGGCGCTAA GCTGGCGGCG 
GGGGGCAGGA GAATGAACAG GAGGGGCTAC TTCTACGAGC CCACCGTCCT CCTCTTCGAC 
GGCGACGCCG AGGCTAAGGC GCTTAGGGAG GAGGTCTTCG GGCCGGTTCT GCCCGTGGTG 
CCCTTCGAGG GGGAGGAGGA GGCCGTCCGC CTCGCCAACG CCACCCAGTA CGGCCTACAG 
TCGGCCGTCT TCACCTCGGA CTACAGGAAG GCGCTTAGGG TGGCGAGAGG CATAAAGGCG 
GGGGCGGTCA TGATAAACGA GAGCACCAGG GTGAGGTTCG ATGCCCTTCC CTACGGCGGC 
GTTAAGATGT CGGGCTTCGG CTGGAGAGAG GGCGTGAGGT CGACCATGAT ATACTACACA 
GAGCCCAAGT TCCTCGTCTT CGGGCTTTGA

Protein sequence

MTNLVVVNPA TEEAIAELPQ ATREDVRRAI DAAWDAFASW SALPLRKRTR VLLKTAELAE 
AAREDLLKTL VAESGKPIRD AEAEITRAID IFRSSAEEAK LILEGSAPRV DAYEYPIGNE 
NRLVVAVREP VGVVGGALSY NNPASTFAHK VAPVIAAGNT VVVKPSSYTP LTALKFLEIM 
KRAGVPEGVV NVVVGSGEEV FDELIQSDKV AGINFTGSTA VGLQVAAKAA SRGKKFMIAP 
GGSDPAVVFK DADLDAAARI VARARYENAG QNCNATKRVF VEREVYPRFV ELLLGYVKAI 
RVGDPMDYST DMGPLISEKI VKAMDGVVKD ALEKGAKLAA GGRRMNRRGY FYEPTVLLFD 
GDAEAKALRE EVFGPVLPVV PFEGEEEAVR LANATQYGLQ SAVFTSDYRK ALRVARGIKA 
GAVMINESTR VRFDALPYGG VKMSGFGWRE GVRSTMIYYT EPKFLVFGL