Gene Nther_0639 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nther_0639
Symbol
ID	6315190
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Natranaerobius thermophilus JW/NM-WN-LF
Kingdom	Bacteria
Replicon accession	NC_010718
Strand	+
Start bp	661714
End bp	662946
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	39%
IMG OID	642643022
Product	diaminopropionate ammonia-lyase
Protein accession	YP_001916822
Protein GI	188585277
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01747] diaminopropionate ammonia-lyase family [TIGR03528] diaminopropionate ammonia-lyase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.604891
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTTTAA CTTGTAGGAA TCAGTACCGA TCCGAAAAAC TCCTTGTCAA TCAAAACCAA 
TTAGATTACA TAGAACAAGT AGTTAAATTT TATCAAAAAA TCACTAATTA TCAACCTACA 
CCTCAAATCT CTTTACATGA CATGGCGAAT TCCATAGGCG TAAAAAATAT CTTTGTTAAA 
GATGAATCTT CTAGATTAGG TTTGGATTCT TTTAAGGTCC TTGGCAGTTT GTATGCCGTT 
GCAAATATAA TAGCCGAGTA CCTGGGAGAA GACCTGTCTC AACTTGATGA ACAGGAGCTA 
CAAAGTCGTA AAGTAAAAGA ACGGGTGGGT CACTTAACTT TTGTGACAGC CACTGATGGG 
AATCATGGTA AAGGATTGGC TTATGCCGCC AATTTTTTTG GGCATAATGC AGTTGTGTAC 
TTACCTAAGG GTAGTGACAA TGATAGAGTC AAGGCAGTTG AACAAGCCGG AGGTAAAGCT 
TATGTCACTG AAGCTAATTA TGATGATACC GTAATCTTTG CTTCCCAAAA AGCCCAGGAA 
GAAGGTTGGA TTTTAGTACA AGATACTGCC TTTGATTCTT ACACTAAAAT ACCGGGCTGG 
ATAATGGAAG GCTATTCAAT GATAGCCAAG GAAATAGTGG ATTATTTTAA TGCTCAAGAA 
TCAAGTCAAT TCCCCACCCA TCTGATTATT CAGGCAGGAG TTGGTTCTCT GGCGGGAGGG 
GTATTAGATT ACCTGGTCAA TAGATTAGGA GAACAAATTC CCAATATAAT TGTGGTTGAA 
CCGGAAAATG CCGCCTGTAT GCTTAATTCG GCCTTGGAAG AAGGGGGTAC AGCTAAAAGA 
ATATTTGGTG ACTTGGATAC TATTATGACA GGTTTGTCTT GTGGTGCTCC TAATCCCTTA 
GGGTGGAAAG GAATAAAAGA TGCAACTAAT ACATTCATAT CAGTACCGGA CTGGGTAGCA 
GCCAGAGGGC TTAGAATTTT ACATAATCCT CATGGAAGGG ATCCTATAGT GCAAGCTGGT 
TTTTCTGGAA GCCCTGGTAT AGGATTGCTT TCATTATTTG AATTCGATCA TTTTACTGGA 
TTAAAGGATT GGTTGGAAAT AGATGAAGAA TCAGTAGTTT TAACTATAAA TACTGAAAGT 
GTAACAGACC ATGGTAATTA CAAAAGTGTT ATGTGGGATG GCCATCCTTG TACTCCGGTA 
AATGGAGATT TTGACTGGAA AGCGCTTTTA TGA

Protein sequence

MILTCRNQYR SEKLLVNQNQ LDYIEQVVKF YQKITNYQPT PQISLHDMAN SIGVKNIFVK 
DESSRLGLDS FKVLGSLYAV ANIIAEYLGE DLSQLDEQEL QSRKVKERVG HLTFVTATDG 
NHGKGLAYAA NFFGHNAVVY LPKGSDNDRV KAVEQAGGKA YVTEANYDDT VIFASQKAQE 
EGWILVQDTA FDSYTKIPGW IMEGYSMIAK EIVDYFNAQE SSQFPTHLII QAGVGSLAGG 
VLDYLVNRLG EQIPNIIVVE PENAACMLNS ALEEGGTAKR IFGDLDTIMT GLSCGAPNPL 
GWKGIKDATN TFISVPDWVA ARGLRILHNP HGRDPIVQAG FSGSPGIGLL SLFEFDHFTG 
LKDWLEIDEE SVVLTINTES VTDHGNYKSV MWDGHPCTPV NGDFDWKALL