Gene Arth_3095 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3095
Symbol
ID	4444328
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3468547
End bp	3469977
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	66%
IMG OID	639690922
Product	aldehyde dehydrogenase
Protein accession	YP_832574
Protein GI	116671641
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR03374] 1-pyrroline dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0472146
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGTCCAAA CCTTGCAGAA CTTCATAAAC GGCGAGTTCG TCACGCCCGC CGGCACCGGA 
CTGCTGGACA TCGTGAACCC CGCCAACGGT GAGGTGGTGG CGAAGTCGCC CATCTCCGTG 
CAGGCCGACG TCGACGCCGC CATGACGGCA GCCAGCGAGG CGTTCAAATC CTGGAAGCAC 
GTCACCCCGG GCCAGAGGCA GCTGATGCTC CTCAAGCTTG CCGACGCCGT CGAGGCCAAC 
AGCGACGAAC TCGTTGAAGC CCAGCACCGC AACACCGGCC AGGTCCGCAG CCTCATCGCC 
TCCGAGGAAG TCGCCGCCGG GGCAGACCAG CTCCGCTTCT TCGCCGGCGC CGCCCGCATC 
ATGGAGGGCA AGTCCGCCGG CGAGTACTTC GAAGGCCACA CCTCCTACGT GCGCCGCGAA 
CCCATCGGCG TCGTGGCCCA GGTTGCCCCC TGGAACTATC CGTTCCTGAT GGCCATCTGG 
AAGATCGGCC CCGCGCTCGC CGCCGGCAAC ACCGTGGTGC TCAAGCCCTC GGACACCACG 
CCGGAATCCA CCCTGGTCCT GGCCCGCCTG GCCGGTGGGA TCTTCCCGGC AGGCGTCCTG 
AACGTCGTCC TCGGCACCGG CGAAACCGGC GCCATGATGG TGGAGCACAA GGTCCCCGGC 
CTCGTTTCCA TCACCGGATC CGTCCGTGCG GGCATCGCAG TGGCTTCGGG AGCGGCCAAG 
GGCCTCAAGC GGGCGCACCT GGAGCTCGGC GGCAAAGCCC CGGCCATCGT CTTCAAGGAT 
GCCGACATCA AGAAGAGTGC AGCGGCCATC GCCGAGTTCG CCTTCTTCAA CGCGGGCCAG 
GACTGCACGG CCATCACCCG GGTGCTGGTC GAGGACTCAG TCCACGACGA CGTCGTGGCA 
GCCATGGTGG AACACACCAA GACCCTGCAC ACCGGCTCGC AGAACGACGA AGACAACTAC 
TTCGGCCCGC TGAACAACGT GAACCACTTC AACGCCGTGA CGTCTGTGGT GGAGCACCTG 
CCGGAGAACT GCAAGATTGT CACCGGCGGC CACCGCGCGG GGGAGAAGGG CTTCTTCTTC 
GAACCCACCA TCATCACCGG GGCCAAGCAG ACCGATGACG TCGTCCAGAA AGAAACCTTC 
GGGCCCGTCA TTACCGTCCA GAAGTTCAGC ACCGAGGCGG AAGCCGTGGA GCTGGCCAAC 
GACGTCGACT ACGCCCTGGC CTCCAGCGTC TGGACCACGG ACCACGGCAC GGCCATGCGC 
GTCAGCCGCG ACCTGGACTT CGGCGCGGTG TGGATCAACA CCCACATCCT GCTGACCGCG 
GAAATGCCGC ACGGCGGCTT CAAACAGTCC GGCTACGGCA AGGACCTCTC CATGTACGGC 
GTCGAGGACT ACACGCGCAT CAAGCACGTG ATGAGCGCAC TCGACGCGTA A

Protein sequence

MVQTLQNFIN GEFVTPAGTG LLDIVNPANG EVVAKSPISV QADVDAAMTA ASEAFKSWKH 
VTPGQRQLML LKLADAVEAN SDELVEAQHR NTGQVRSLIA SEEVAAGADQ LRFFAGAARI 
MEGKSAGEYF EGHTSYVRRE PIGVVAQVAP WNYPFLMAIW KIGPALAAGN TVVLKPSDTT 
PESTLVLARL AGGIFPAGVL NVVLGTGETG AMMVEHKVPG LVSITGSVRA GIAVASGAAK 
GLKRAHLELG GKAPAIVFKD ADIKKSAAAI AEFAFFNAGQ DCTAITRVLV EDSVHDDVVA 
AMVEHTKTLH TGSQNDEDNY FGPLNNVNHF NAVTSVVEHL PENCKIVTGG HRAGEKGFFF 
EPTIITGAKQ TDDVVQKETF GPVITVQKFS TEAEAVELAN DVDYALASSV WTTDHGTAMR 
VSRDLDFGAV WINTHILLTA EMPHGGFKQS GYGKDLSMYG VEDYTRIKHV MSALDA