Gene Ndas_5213 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_5213
Symbol
ID	9249106
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014211
Strand	+
Start bp	364361
End bp	365626
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	69%
IMG OID
Product	2,4-diaminobutyrate 4-transaminase
Protein accession	YP_003683099
Protein GI	297564126
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.323098
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGACCT TCCAGCGCCT GGAGTCCGAA GTCCGCGGAT ACTGCCGGAA CTGGCCGGTC 
GTGTTCGACC GGGCCGTCGG TAGCCACGTC TACTCCGAGG ACGGCAAGCC CTACCTCGAC 
TTCTTCGCGG GTGCGGGGTC GCTCAACTAC GGGCACAACA ACCCCGAGCT GAAGACCTCG 
CTCATCGAGT ACCTGACCGA CGACAAGATC GTGCACAGCC TCGACGCCTA CAGCGTGGCC 
AAACGCGAGT TCCTGAAGAC CTTCGAGGAG ATCATCCTCA AACCCCGGGG CCTCGACTAC 
AAGGTCCAGT TCCCCGGACC CGCGGGCAAC AACGCGGTCG AGGCCGCGCT CAAGCTGGCC 
CGCAAGTACA CCGGTCGCGA GACCATCGTC AACTTCACCA ACGGCTTCCA CGGCATGACC 
CTGGGCGCCC TGGCCGTCAC CGGCAACTCG ATGAAGCGCG GCGGCGCGGG CGTGCCGCTG 
GGCCACGTCG CCACGATGCC GTTCGACAAC TACCTGGACG GCAAGACGCC GGACTTCCTG 
TGGCTGCGCA GCCTGCTGGA CGACAGCGGC AGCGGCCTGG ACAAGCCCGC GGCCGTCATC 
GTCGAGACGG TCCAGGGCGA GGGCGGCATC AACGCCGCCA GCGCCCAGTG GCTGCGCGAG 
CTCTCGGACC TGTGCCGCGA GTACGGCATC CTCATGATCG TCGACGACAT CCAGATGGGC 
TGCGGCCGCA CCGGCGACTT CTTCAGCTTC GAGGAGGCCG GGATCACCCC GGACATCGTC 
ACGCTGTCCA AGTCCATCAG CGGCTACGGC CTGCCCATGG CCCTCACCCT GTTCAAGCGC 
GAGCTGGACG TGTGGGAGCC GGGTGAGCAC AACGGCACCT TCCGCGGGTT CAACCCGGCC 
ATGGTGACCG CCGTCGGGGC CCTGCGCCGC TACTGGAGCG ACTCGGCCTT CTCCGACTCC 
GTCAAGGCCA AGGGCGACAT GGTCGCCGCC CGCCTGGCCG AGATGGCCGC CGAGCACGCC 
GAGTTCGGCG CGCACGTGCG CGGCCGCGGC CTGGCCCGGG GCCTGGCCTT CGAGCAGACC 
GACATCGCCA AGAAGGTCGC CGCCGAGTCC TTCGAGCGGG GCCTGCTCCT GGAGACCTCC 
GGCCCCGAGG ACGAGGTGGC CAAACTCCTG CCGCCGCTCA CGGCGAGCGA GGAGGAACTC 
ACGGCCGGTC TTGACATCAT GGCTGACGCG GCCCGCGCCG CGGTCAAGGC GGCCCAGCCC 
GCCTAG

Protein sequence

METFQRLESE VRGYCRNWPV VFDRAVGSHV YSEDGKPYLD FFAGAGSLNY GHNNPELKTS 
LIEYLTDDKI VHSLDAYSVA KREFLKTFEE IILKPRGLDY KVQFPGPAGN NAVEAALKLA 
RKYTGRETIV NFTNGFHGMT LGALAVTGNS MKRGGAGVPL GHVATMPFDN YLDGKTPDFL 
WLRSLLDDSG SGLDKPAAVI VETVQGEGGI NAASAQWLRE LSDLCREYGI LMIVDDIQMG 
CGRTGDFFSF EEAGITPDIV TLSKSISGYG LPMALTLFKR ELDVWEPGEH NGTFRGFNPA 
MVTAVGALRR YWSDSAFSDS VKAKGDMVAA RLAEMAAEHA EFGAHVRGRG LARGLAFEQT 
DIAKKVAAES FERGLLLETS GPEDEVAKLL PPLTASEEEL TAGLDIMADA ARAAVKAAQP 
A