Gene Arth_4222 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4222
Symbol
ID	4443588
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008539
Strand	+
Start bp	55540
End bp	56913
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	58%
IMG OID	639687747
Product	hypothetical protein
Protein accession	YP_829444
Protein GI	116662391
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCACGCG ATGATGATGA GAGCACGCTT GAGTTCATAG TCGACTCTCT TGAGGCCAAC 
GCCCTGGACG AATCCGATGA CTTTGAGTTT GATCCGGAAA CGGCAGAAAT ATTGTCTGAT 
CCCGAATCGG ATCCTGGAAT CACCATCGAA GACACCGAGG AGGCCCAAGA CCCTGTGGCT 
CAAGCGCTAA AGCCTGGGGC GCCCCTTTTC TTGCTCCATA AGAGCGCCCA CCACTCTGCG 
ATCCTTCCTG CAGTGGCAGC CGATATAACA GTCAAGCATG GCGGAGCACT TCACGTTGGC 
GTCGCCGCGT CCGTGCCGAG AACTACTCCG CAGGCCCTGA AACGATTCTT CGAGTCAATG 
CCTTCCACGA CCCTTCGTTT CGCGGATCCG GAAGCTTTCG CACGACACGA TTCCTTGGGA 
CCGTATATTG CCGCTCAACG GGAGGACAAG CCGTTGGTGG GCAGGACTGG CGCTCATTGG 
AAATACTTTG GGGACCCACA GGTTGGAGGA AGGAATGCGA CCTGGGTTAA GGATGTATTG 
GACGCCCAAC GATCCATGGG CGCGTCTGTC CTGCTGACCC CCGGAGTCTG GGCCGATCCC 
ACAAGCGCTC AAACTGCACT TACGGAGGCT CGGCAGCACG CTTCATGGGC GCGCACTGCG 
CTGACTCCAG GGGAACACCT TGCGGTAAAC ATTACGCTGT CATGCCAGTG GCTCACCAAT 
ATCCACCTGA GAGACAAGCT CCTCAACGAG ATCCTCGACA TGGATGAAGA CGTTTTTTAC 
ATCCGCGTCA GGTGGCCCTT GATGCCCCAG ACTTACGGAC AGCTCCTAGA CCAGGCCATT 
CTTGATGGTT ATGTCGAGCT TGCCAATGTG TTTGAAGACA ACGACAAAGT GTTGATCCTC 
CCTAACACGG GCCTCACCGG GTGGGCAGCA CTTGCTTGGG GAGCCCACGG CTACTCCACT 
GGTATCGGCT CCGGCGAGCG AGCCTTTGCT GACACCCGCG TCATCCGGAT GAAAAGGACG 
AACCCCCGAC CTGCCCCCAC GAACCGCACG TTCGTTACAG ATATCCTCCA TGTCACTGAC 
GTGACCACTG CAACCCAGTT GGATCAATTG GCTGGCGGAG CTTGCCGATG CCGATTCTGC 
GCAAGTCAGC GGAAACTCAC TCAGTGGAAC AAGGCACTTG CGGGAGCACA CTATCTGCGG 
CAGGTGGCCG ATATTACGGC CACTATCTCA ACAAGCGCTC GAGGCCGCCG GGCGGGCGCC 
CGTCGTATCG TTCGGGCCGC AGCCACCCAG GCTGCGACAG CCACGCGGAG AGTGCCCCTA 
GCCGCGACTA ACGAACCAAA GCATTTGCCT CTATGGAGCG CCCGTCTGCG CTAG

Protein sequence

MSRDDDESTL EFIVDSLEAN ALDESDDFEF DPETAEILSD PESDPGITIE DTEEAQDPVA 
QALKPGAPLF LLHKSAHHSA ILPAVAADIT VKHGGALHVG VAASVPRTTP QALKRFFESM 
PSTTLRFADP EAFARHDSLG PYIAAQREDK PLVGRTGAHW KYFGDPQVGG RNATWVKDVL 
DAQRSMGASV LLTPGVWADP TSAQTALTEA RQHASWARTA LTPGEHLAVN ITLSCQWLTN 
IHLRDKLLNE ILDMDEDVFY IRVRWPLMPQ TYGQLLDQAI LDGYVELANV FEDNDKVLIL 
PNTGLTGWAA LAWGAHGYST GIGSGERAFA DTRVIRMKRT NPRPAPTNRT FVTDILHVTD 
VTTATQLDQL AGGACRCRFC ASQRKLTQWN KALAGAHYLR QVADITATIS TSARGRRAGA 
RRIVRAAATQ AATATRRVPL AATNEPKHLP LWSARLR