Gene Arth_4216 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4216
Symbol
ID	4443582
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008539
Strand	-
Start bp	48948
End bp	50669
Gene Length	1722 bp
Protein Length	573 aa
Translation table	11
GC content	68%
IMG OID	639687741
Product	hypothetical protein
Protein accession	YP_829438
Protein GI	116662385
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGCCCCC GCTGCCAAAT CAACCGTGTC GCCTGGACCT TCCCTCGGGT GGACTATTGC 
TATGTCTGCC TTCCCGGCGG GCCGTTCATT GCACCGCCGT GCTCCAAGTG CGGAACCGAC 
ATGGGCTACT TCAGCCAGGG CATGTGTGCC GGCTGCCATC CCGGCAGCCC ACAATACCCA 
GGCTCGTGCA AGGACTGTCT GGCGTGGGGT GTCTACCGCC GCTACAAGTG GACGTGCTGG 
CCGTGTCGAT GGTGGCGTTC CCACTACCCG GAAGGAGTCT GCGACTTCTG CGGGCGCGCC 
GCCCGTGTCG GAGAGCGGCG GGCCTGCCGG CTGTGTCTGG AGCAGGCCCG AATGGTCCAG 
GAGCCCGGAC ACGGCCTGGA CCTGGCCGGC GCGAATAGGG ATGGCCACCA GCTCTTCTTC 
GCCAACATGA GCTTCCACCG CCGCGGAGCA CCACACTTGA GCCCGGACCA GCGCGCCCCA 
TGGAAACGGC GGGACAAGAA CAACCCGCCC GGCCCCGGAT CTGCTGCCGA CCACGGCGGG 
CAGATGACGT TGTTCGATAT GGCGCCCGAT CCCGCCGTCG TCGCAGCGCG TCTCCGCCTC 
GAAGAAAGGG ACCTGACCCG CTACTGCGCC GCCATCGTCC GTGAACACGC CGAGAGGGCC 
GGCTGGAGCA AGCGGCAACG CAACGACGTA ACCCGCTCGC TGCGGCTGCT GCAGGGTTTC 
CGGCTCAGCC CGACCGCGAA GATCCGCGCC ACCGACGTCC TCCAGCTGCG CCAATACTCC 
GGCAACGTCC TCTCCACGAT CGACGTGCTG GCCGCGGCCG GCCTGCTCAT CGAGGACCGG 
CCGACCCGGC TCGAACGCTA CTTCGCTGCC AAGACCAGCA CCCTGCCACC GGTCATGAAG 
GACCAGCTCG AGGTGTGGCT GCAGGTCCTG ACCAACGGCG CCCACCAGGC GCCACGGCAG 
ATCCCGCGCG ACCCACAGAC CATCAGGGCG CACATCATGG GCATCGAACC CATCATCCAC 
GCCTGGGCCG GAGCAGGCCT CCAATCCTTC GCCGAGGTCA CCCGCACCGA CATCACAGCC 
GCGCTGGACG AAACGACGGC CCGCCGCCAC ATCGCCGGGA ACGGACTCAA GTCGCTCTTC 
ACGACCCTCA AAGGCCGCCG GCTCATCTTC GCCAATCCGA CCCGCGGGAT GAAGGCGTCC 
CCGAAGGCCA GCACTATCCC TCTCGCCCTG GACGCCGCAG CGATCCGCGA GGAGCTGAAC 
TCCCCGAAGC CGGTCGTCGC CCTCGCGGTT GCCTTGGTCG CCTTCCACGC ACTGACCAAG 
AAACAGCTCA GCGAGCTGCG CCTCACCGAC ATCAGCGACG GACACCTGGT ACTCGGCACC 
CGCGACATTC CGCTGGCCGC GCCCGTGCGC ACCCGCCTGG CAGCCTGGCT CGACCAGCGC 
AACCGAACCT GGCCAGGCAG TGCCAACCCG CACCTGCTCA TCAACCGGCG TACGGCGCCC 
CGGCTCCTGC CCGTCAGCCG GCAGTACCCC TGGACCGGAT TGACGCTGCG GCCCCAGGCG 
CTGCGCGAGG ACCGAATCCT CCACGAGATC CACGCCACCG GCGGCGACAT CCGCCGCATC 
TGCGACCTGT TCGGGCTCAG CGTCGAAGGC GCCACCCGCT ACCTCAACAC CGTCGAGCAC 
CCCGACCTCA CCCTTGAAGG CGAACAGGTT CCCCGAACCT GA

Protein sequence

MCPRCQINRV AWTFPRVDYC YVCLPGGPFI APPCSKCGTD MGYFSQGMCA GCHPGSPQYP 
GSCKDCLAWG VYRRYKWTCW PCRWWRSHYP EGVCDFCGRA ARVGERRACR LCLEQARMVQ 
EPGHGLDLAG ANRDGHQLFF ANMSFHRRGA PHLSPDQRAP WKRRDKNNPP GPGSAADHGG 
QMTLFDMAPD PAVVAARLRL EERDLTRYCA AIVREHAERA GWSKRQRNDV TRSLRLLQGF 
RLSPTAKIRA TDVLQLRQYS GNVLSTIDVL AAAGLLIEDR PTRLERYFAA KTSTLPPVMK 
DQLEVWLQVL TNGAHQAPRQ IPRDPQTIRA HIMGIEPIIH AWAGAGLQSF AEVTRTDITA 
ALDETTARRH IAGNGLKSLF TTLKGRRLIF ANPTRGMKAS PKASTIPLAL DAAAIREELN 
SPKPVVALAV ALVAFHALTK KQLSELRLTD ISDGHLVLGT RDIPLAAPVR TRLAAWLDQR 
NRTWPGSANP HLLINRRTAP RLLPVSRQYP WTGLTLRPQA LREDRILHEI HATGGDIRRI 
CDLFGLSVEG ATRYLNTVEH PDLTLEGEQV PRT