Gene Arth_0148 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0148
Symbol
ID	4447411
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	152412
End bp	153539
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	67%
IMG OID	639687943
Product	hypothetical protein
Protein accession	YP_829649
Protein GI	116668716
COG category	[S] Function unknown
COG ID	[COG5282] Uncharacterized conserved protein
TIGRFAM ID	[TIGR03624] putative hydrolase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACGCTA TGGAGTCAAC TGCAGGCGAT TCATCGGTAC AGGCCCAGGC GCTGATCAAC 
TGGGAGCTCG CGGCGTCAAC CGCTGCGCGG CTGGCTCCGG CAGGCCCTTC GCTGGGTTCC 
GCCGAAATCG GGACGGCCGT GGAGAACCTG CGCCTGATGG CGGACATCTC CGTGCCGCAC 
GTCCATGACA TCACCGGGCT GGAAGCCGCG CGGGACCTCC GCGATTCCTC CGTGCTGGTG 
GTGGACCGCG CCTCCTGGGC CAAGGCCAAC ACCCAGAGCT TCACCGTCAT GCTGAAGCCG 
GCGATGGAAA AGATGCTGGA GGGCCGCCGC GGAACCATGA GCCCCGGTGC GGCGTCCGTC 
AGCGGCGCCA TCACGGGTAG CCAGTTGGGC GCCGTGCTCG CCTTCCTCTC CAGCAAGGTC 
CTGGGCCAGT ACGATCCTTT CTCGGCACTC GCCGAAGACT CAACGGCCCC CGCCGGCGGA 
CGCCTTCTGC TGGTTGCGCC GAACATCGTC CAGGTGGAGC GCGAACTCAA CGTTGCCCCC 
GAGGACTTCC GGCTGTGGGT CTGCCTGCAC GAACAGACGC ACCGCGTGCA GTTCGCGGCC 
GCACCCTGGC TGCGCCACCA CATGCTCAAC GAGATCGACA ACCTTAGCGA GCACCTGCTG 
GGCAACGTCG ACACCCTCCT CGAGCGCGCG TCGGCTGCGG CCAAATCACT CAAGGACCGC 
ACGGCCGCCG GAACGGCTCC CGGGCGCGGC GCTATCCTGG ACCTGCTCCA GGACCCGGAA 
GAAAAAGCCT CCCTGTCACA CCTGACCGCC GTGATGAGCC TGCTGGAAGG CCACGCCAAC 
GTGGTGATGG ACGCGGTCGA CGCCAGCATC GTCCCGTCCG TCAAGACCAT CCGGCAGCGC 
TTCAACGCCC GGGGCAAGGA CCGGGGCGTC GTGGAGAAAT TCATCCGCAG CCTGCTGGGC 
CTCGATGCCA AGATGCGCCA GTACACGGAC GGCGCCAAAT TCGTCCGCGC CGTGGTGGAC 
GTGGCTGGCA TGGAAGGCTT CAACCGGGTC TGGGAATCCG CTGCGAACCT GCCCACGGAA 
CCGGAAATCC ATGACGCCAA GCTCTGGCTC GAGCGGATGG GGCTCTAG

Protein sequence

MDAMESTAGD SSVQAQALIN WELAASTAAR LAPAGPSLGS AEIGTAVENL RLMADISVPH 
VHDITGLEAA RDLRDSSVLV VDRASWAKAN TQSFTVMLKP AMEKMLEGRR GTMSPGAASV 
SGAITGSQLG AVLAFLSSKV LGQYDPFSAL AEDSTAPAGG RLLLVAPNIV QVERELNVAP 
EDFRLWVCLH EQTHRVQFAA APWLRHHMLN EIDNLSEHLL GNVDTLLERA SAAAKSLKDR 
TAAGTAPGRG AILDLLQDPE EKASLSHLTA VMSLLEGHAN VVMDAVDASI VPSVKTIRQR 
FNARGKDRGV VEKFIRSLLG LDAKMRQYTD GAKFVRAVVD VAGMEGFNRV WESAANLPTE 
PEIHDAKLWL ERMGL