Gene Arth_4277 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4277
Symbol
ID	4443528
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008538
Strand	-
Start bp	10081
End bp	11700
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	67%
IMG OID	639687598
Product	hypothetical protein
Protein accession	YP_829295
Protein GI	116662241
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCGGCA GCAAGACCAA GCACCAGCGC ACACAGGCCC CGGCCCCGGC CACGAAGCTC 
GCCGCCGCGG TCGCCCGCCG CCCGGGTCTG CGGGGCTGGC GCGGCCGCGG ACAGGGCGAA 
GCCGTCTACG TCACGGCAGC CGACGAATGG CGCGGCACCT CGGTCCAGGT CTGCGGTCTC 
TGGCCGTTCG TGGGCGGGTC CGGCACCCCG ATCCTGGGAG TGCCGATCGG TGTTCACACC 
GACACCGGAG CGCCCTTCGG GGCCGATCCG ATCAGCTGGT TCATGCACGG CATGATCAAC 
AACCCATCCA TGTTCGTCCT GGGCCTGCCG CACTGCGGCA AGTCCACCCT GGTCCGGCAC 
ATCGTCCTGG GCCTGGCAGG CCGCAGCATC AACCCGTTGA TCCTCGGTGA CCTGAAGCCG 
GACTACGTTG ACCTGATCGA AGCACTCGGC GGGCAGGTCA TCAGCCTGGG TCCTGGACGC 
GGCCACTTGA ACGTCCTGGA CCCCGGTGAA GCCACGGGAG CCGCCGTCAG GCTGCTCGCC 
TCGGCCGAGG AACACCGGGC CAAAGCGAAC CGGACCCTGA ACGATCCAGA TGGCGACCAG 
GCAGCGGCCG CGCAGCTGCT CGCTGCCGCG GTGAAGGCGG AGAAGCTGGC CGAACAGCTG 
ATGGCGGACT CGCACAACCG GCGCCTGAAC ATGATCACCG CGCTGATCAC CATCGTGCGG 
AACAGCAAGC CCAGCGCCCA TGAGGAATCC CTGATTGACA GGGCCCTGCA CATCCTGGAC 
GAGCGCCTGG ACCGCGTTCC CCTGATCGGG GATCTGATCG AGGTCATCAA AGACGCCCCC 
GACGAACTGC GCGCGATCGC CCTGGACCGT GGCGATATGA GCCGCTACCT CGACGCGACC 
GACCAGCTGC GCCAGTCGCT GTACTCCCTC GACGGCTCGG GCCGGTTCTC GGACATGTTC 
TCCCAGCCCA CCGACCAGCC GATGGACCTG ACCAAACCCG TGGTCTTTGA CCTGTCAGGG 
ATCTCCGACA CGCAGCGCGA CATCCAAGCG GCCTGCCTGC TGGCCTGCTG GTCAACAGGG 
TTCGCCACCG TCCAGGTCAC CCACACCCTG GCCGACGCCG GCCTGGAACC GCGCCGGAAC 
TACTTCGTCG TCATGGACGA ACTGTGGCGG GCCCTGCGCT CCGGTGAGGG CATGGTGGAC 
CGGGTTGACT CGCTGACCCG CCTGAACCGG ACCGAGGGCG TCGGGCAGGC CATGATCACG 
CACACCATGA GCGACCTCGA AGCTCTGCCA ACCGAATCCG AACGGATGAA AGCGCGCGGA 
TTCGTCGAAC GCTCCGGCAT GGTCGTCTGC GGCGCGCTCC CCGGAGCCGA AATGGAAAAA 
CTCAACAAAG CCGTCACCCT CTCCCGGGCC GAACAAGCCC GCCTCATCTC GTGGGCTGAC 
CCGGGGTCAT GGACCGACGT CGGCGGATCC CGCAAACGCG TACGCCCGGG CCTGGGCAAA 
TTCCTCTTCA AAGTCGGCGG CCGCCCCGGG ATCCCGGTCG CCCTCAAACT AACCAGCGTC 
GAGGAATCGC TACACGATAC AAACAAGCGC TGGACGATCA ACAGTGAGAA GTTCGCGTGA

Protein sequence

MFGSKTKHQR TQAPAPATKL AAAVARRPGL RGWRGRGQGE AVYVTAADEW RGTSVQVCGL 
WPFVGGSGTP ILGVPIGVHT DTGAPFGADP ISWFMHGMIN NPSMFVLGLP HCGKSTLVRH 
IVLGLAGRSI NPLILGDLKP DYVDLIEALG GQVISLGPGR GHLNVLDPGE ATGAAVRLLA 
SAEEHRAKAN RTLNDPDGDQ AAAAQLLAAA VKAEKLAEQL MADSHNRRLN MITALITIVR 
NSKPSAHEES LIDRALHILD ERLDRVPLIG DLIEVIKDAP DELRAIALDR GDMSRYLDAT 
DQLRQSLYSL DGSGRFSDMF SQPTDQPMDL TKPVVFDLSG ISDTQRDIQA ACLLACWSTG 
FATVQVTHTL ADAGLEPRRN YFVVMDELWR ALRSGEGMVD RVDSLTRLNR TEGVGQAMIT 
HTMSDLEALP TESERMKARG FVERSGMVVC GALPGAEMEK LNKAVTLSRA EQARLISWAD 
PGSWTDVGGS RKRVRPGLGK FLFKVGGRPG IPVALKLTSV EESLHDTNKR WTINSEKFA