Gene Arth_3726 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3726
Symbol
ID	4443727
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4196599
End bp	4198302
Gene Length	1704 bp
Protein Length	567 aa
Translation table	11
GC content	67%
IMG OID	639691550
Product	choline dehydrogenase
Protein accession	YP_833201
Protein GI	116672268
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID	[TIGR01810] choline dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.191041
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGAGA CCAGCTACGA CTACGTCATC GTCGGTGGGG GAAGTGCCGG TTCCGTGCTG 
GCAAACCGCC TGAGCGCAGG GGGCACGCGC AGCGTCCTGG TTCTGGAAGC GGGACGAAGC 
GACTACCCCT GGGATCTGTT CATCCAGATG CCGGCTGCCC TGACCTTCCC CAGCGGGAAT 
CCTCTCTATG ACTGGCGCTA CCAGTCGGAT CCGGAGCCGC ATATGGGGGG ACGCCGGGTG 
GCCCATGCCC GCGGCAAGGT CCTGGGCGGC TCGAGCTCCA TCAACGGCAT GATCTTCCAG 
CGTGGAAACC CGCTGGACTA CGAACGCTGG GGAGCCGACG ACGGGATGGA AACCTGGGAT 
TTCGCGCACT GCCTGCCGTA CTTCAACCGG ATGGAAAACG CGCTCGCGGC GGATCCGGAC 
GATGACCTCC GCGGCCACTC GGGACCCTTG GTCCTGGAGC GCGGCCCTGC CACCAACCCG 
CTGTTCCAAG CCTTCTTCAA GGCAGCACAG GAAGCGGGAT TCCCGCTGAC GGATGACGTG 
AACGGCTACC GCCAGGAGGG CTTCGCGGCG TTTGACCGGA ACGTGCACAA GGGGCAGCGG 
CTTTCCGCGT CCCGGGCCTA CCTGCGCCCC GGGGCCAAGC GGCCCAACCT GACGGTCCGC 
ACCCGCGCCC TGGTCACGAA GGTGAACTTC AAGGGCAACG TTGCCACCGG CGTCACCTAC 
CGCCGCAACG GCAGGACGCA CCAGGTGAAC GCCGGAGAGG TGATCCTGTC CGGCGGCGCC 
ATCAATACCC CCCAGCTGCT GCAGCTTTCC GGCATCGGGG ACGCCACCCA CCTCAAGTCG 
CTCGGCATCA AGCCCGTGGT CCACCTCCCT GGCGTGGGCG AGAACCTGCA GGACCACCTG 
GAGGTCTACA TCCAGCACGC CTGCACCCAG CCGGTGTCCA TGCAGCCGAA CCTTGACCTG 
TGGCGCTACC CGCTCATCGG CCTCCAGTGG CTCCTGGGCC GCAAGGGTCC CGCGGCCACC 
AACCACTTCG AGGGCGGCGG GTTCGTCCGC TCCAACGATG AGGTGGCGTA CCCCAACCTG 
ATGTTCCACT TCCTCCCCGT CGCCGTGCGG TACGACGGCC AAAAGGCGGA TGCGAAGCAC 
GGCTACCAGG TGCACATCGG CCCCATGTAT TCCGACGCCC GCGGCAGCCT CAAGATCACA 
TCCACGGATC CCACCGTGCA CCCCTCCATG GTGTTCAACT ACCTCTCCAC CGACCAGGAC 
CGCCGCGAAT GGGTGGAGGC CATCCATATC GCCCGCGACA TCCTCGGCCA GTCCGCCATG 
GGCCCCTTCA ACGGCGGGGA GCTTTCCCCT GGCCGGAGTG TCCAGACCGA CGCCGAAATC 
CTGGACTGGG TGGCGCGCGA CGCCGAAACA GCCCTGCATC CGTCGTGCAC CGCGAAGATG 
GGGCCGGAAT CGGACCCGAT GGCCGTGGTC AATCCGCTCG ACATGAGCGT GCACGGGGTC 
AAGGGCCTCC GCGTGGTGGA TGCCTCGGCC ATGCCGTACG TGACCAACGG CAACATCTAC 
GCCCCGGTGA TGATGCTCGC CGAGAAGGCA GCCGACCTGA TTGCCGGAAC GGCCCCGTTG 
GCCCCGCGGC ATGCCGAGTT CTACCGCCAT GGGCACAGCC CGCTGATGCG GGACCAGGCC 
GCCGCCGCAG CGGCGAAGGG CTAG

Protein sequence

MTETSYDYVI VGGGSAGSVL ANRLSAGGTR SVLVLEAGRS DYPWDLFIQM PAALTFPSGN 
PLYDWRYQSD PEPHMGGRRV AHARGKVLGG SSSINGMIFQ RGNPLDYERW GADDGMETWD 
FAHCLPYFNR MENALAADPD DDLRGHSGPL VLERGPATNP LFQAFFKAAQ EAGFPLTDDV 
NGYRQEGFAA FDRNVHKGQR LSASRAYLRP GAKRPNLTVR TRALVTKVNF KGNVATGVTY 
RRNGRTHQVN AGEVILSGGA INTPQLLQLS GIGDATHLKS LGIKPVVHLP GVGENLQDHL 
EVYIQHACTQ PVSMQPNLDL WRYPLIGLQW LLGRKGPAAT NHFEGGGFVR SNDEVAYPNL 
MFHFLPVAVR YDGQKADAKH GYQVHIGPMY SDARGSLKIT STDPTVHPSM VFNYLSTDQD 
RREWVEAIHI ARDILGQSAM GPFNGGELSP GRSVQTDAEI LDWVARDAET ALHPSCTAKM 
GPESDPMAVV NPLDMSVHGV KGLRVVDASA MPYVTNGNIY APVMMLAEKA ADLIAGTAPL 
APRHAEFYRH GHSPLMRDQA AAAAAKG