Gene Ndas_3663 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3663
Symbol
ID	9247532
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	4397423
End bp	4398760
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	72%
IMG OID
Product	4-aminobutyrate aminotransferase
Protein accession	YP_003681567
Protein GI	297562593
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGCGA CCGAGGTCGC CCAGTCCCGC CGGATCGTCA CCGAGATCCC CGGCCCCAAG 
TCCCGCGCGA TCCAGGAGCG CCGCCGTTCG GCCGTCGCCC AGGGCGTGGG CAGCGTCCTG 
CCGGTCTACG TCGAGCGCGC GGGCGGCGGC ATCGTCGAGG ACGTCGACGG CAACGCGCTG 
ATCGACTTCG GCTCCGGCAT CGCCGTGACC AACGTCGGCA ACGCCGACCC GCGCGTGGTG 
GAGCGCGCCG CCGAGCAGCT CGGCCGGTTC ACGCACACCT GCTTCATGGT CAACCCGTAC 
GAGGCGTACG TGGACGTGTG CGAGGCACTC AACCGGATCA CGCCGGGCGA CCACGAGAAG 
CGCTCGATCC TGCTCAACTC GGGCGCCGAG GCGGTCGAGA ACGCGGTGAA GATCGCCCGC 
AGCGCGACCG GCCGCCAGGC GGTCGTGGTG TTCGACCACG CCTACCACGG CCGCACCAAC 
CTCACCATGG GGCTGACCGC CAAGAACATG CCCTACAAGC AGGGCTTCGG GCCGTTCGCC 
GGTGAGATCC ACCGGATGCC GATGGCCTAC CCGTACCGCT GGCCGACGGG CCCGGACAAC 
TGCGGCCCCG AGGCGGCGGC CATGGTGATC GAGCAGATCA CCAAGCAGAT CGGCGCCCAG 
AACGTGGCGG CCGTGGTGAT CGAGCCGATC CAGGGCGAGG GCGGCTTCAT CGAGCCCGCC 
CCCGGCTTCC TGCCCGCGGT GGTGGAGTTC TGCCGCGCCA ACGGCATCGT GTTCGTCGCC 
GACGAGGTGC AGACCGGCTT CGCCCGCACC GGCCACATGT TCGCCAGCGA GCACGAGGGC 
GTGGTCCCGG ACCTGATCAC GACCGCCAAG GGCATCGCGG GCGGCCTGCC GCTGGCCGCG 
GTGACCGGCC GCGCCGAGCT GATGGACGCC GTGCACGGCG GCGGCCTGGG CGGCACCTAC 
GGCGGCAACC CGGCCGCGTG CGCCGCCGCG CTGGCCGCGC TGTCGGCGAT CGAGTCCGAC 
GGCCTGGTGG AGCGCGCCCG TGAGATCGGC GAGCTGATGC TGGGCCGCCT GCGCGAGCTG 
GCCGCCAAGT ACGAGGTCAT CGGCGACGTG CGCGGACGCG GCGCGATGAT CGCGATCGAG 
CTGGTCCAGG ACGCCGACCG CACGCCCGCC CCCGAGGCGC TGGCCAAGGT CCTGTCCTAC 
TGCCACTCCC GCGGCCTGGT CCTGCTGAGC GCGGGCACCT ACGGCAACGT GATCCGCATG 
CTGCCGCCGC TGGTGATCGG CGACGAGCTG CTGCACGAGG GCCTGGACAT CCTGGAGGAG 
GCCTTCGCCC GGCTGTAG

Protein sequence

MAATEVAQSR RIVTEIPGPK SRAIQERRRS AVAQGVGSVL PVYVERAGGG IVEDVDGNAL 
IDFGSGIAVT NVGNADPRVV ERAAEQLGRF THTCFMVNPY EAYVDVCEAL NRITPGDHEK 
RSILLNSGAE AVENAVKIAR SATGRQAVVV FDHAYHGRTN LTMGLTAKNM PYKQGFGPFA 
GEIHRMPMAY PYRWPTGPDN CGPEAAAMVI EQITKQIGAQ NVAAVVIEPI QGEGGFIEPA 
PGFLPAVVEF CRANGIVFVA DEVQTGFART GHMFASEHEG VVPDLITTAK GIAGGLPLAA 
VTGRAELMDA VHGGGLGGTY GGNPAACAAA LAALSAIESD GLVERAREIG ELMLGRLREL 
AAKYEVIGDV RGRGAMIAIE LVQDADRTPA PEALAKVLSY CHSRGLVLLS AGTYGNVIRM 
LPPLVIGDEL LHEGLDILEE AFARL