Gene Arth_4271 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4271
Symbol
ID	4443439
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008538
Strand	-
Start bp	2355
End bp	4136
Gene Length	1782 bp
Protein Length	593 aa
Translation table	11
GC content	57%
IMG OID	639687592
Product	hypothetical protein
Protein accession	YP_829289
Protein GI	116662235
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTCCGC GCACCATCGA TCCCCGCATC AGCCTCGCAC TGTCCGTACA AGCCCAGCCC 
GGTGTTTATG CCCTCCTTAT CGGTTCCGGA ACTTCCACCG GGGCCGGGAT CCCCACAGGC 
TGGGGAGTCA TCAAGGACTT GGTGCGCCAA GCCGCAGCAG CAGAGGGCAC AACACTGAGT 
GCTGACCCCG CCGACGAGGA AATAGATGAA TGGTGGGTTA ACCATGGTGA TGGCAACGAG 
CTCGGATACT CCGGGCTCCT TGAATCACTA GGCCGAACGC CTGCCGCCCG CAGCGCACTC 
CTGCACAGCT ACTTCGAACC AAACGACGAG GATAGAGCGG ACAACCGCAA GGTGCCCGGT 
AAGGCACACC ACGCAATTGC TGAACTCGTG CAACGAGGAG CCATACGTGT TATCCTCACC 
ACCAATTTCG ACAGCCTCAT CGAGCAAGCA CTAGATCAGG CGTCCGTTCC GTACCAAGTG 
CTGTCCTCAG AGAGTGCTAT CAAAGCGCGA AAGCCACTGC ACCATGCTGA CTGCACTGTC 
ATAAAGCTTC ACGGGGATTA CAAGTCACTT GACCAGAAAA ACACGCTGGC CGAGTTGACC 
GACTACGGGC AGGCAACACG TGAAATTCTC CACGAGGTCA TGGAAAACTT CGGGCTGATC 
ATTAACGGGT GGTCAGCCGA CTGGGACAAA GCATTGGTAG AGGCGCTGGA AGGCCGCCAG 
AGTCGCCGCT ATCCGTTGTA CTGGACTACG TTGTATGGCC CAGGGCCTGC GGCCGCCGCG 
CTGATCGAAC AACATGGAGC CGCCGTTATC AGCGGCGTCA CCGCCGACGA ATTCTTCCCA 
GACCTGCAGC AACGGCTCGA ATCCCTAGAT TCTCTTGCCG CACCGCAGCT AACTGAAGAT 
ATGGCAATCG CCCGCCTCAA GAGGCTCCTT CCGTACAGGG AGTCCTACAT CGAGATACGT 
GAACTCTTGA CCAGTGAAAT CAGAACGCTG GCCTCGTACA TCCGTGAGCG CGGGGGTTCC 
TTTCCTCCTG GTGGAGATTA CGCAACTGCC TTCGATAATG AATGTTTGTC CCTCCGTAAC 
CGCTCGCAAA CTCTGATTCG TCTAATCGCG ACCGGTGTGG CATTTGACCG TGACCGCATT 
CACGGTGACC TTTGGGTGTG GGCGGTTCAG CAGCTCATGA AGGCGAGAGG GCAGGTTTCG 
TCCTTTCAGG AAGGCTGGTT CAATTTGGCC CATTACCCTG CCCTATTGGC TCTACGGGCC 
ATAGCGATGA TTGCTGTCAC CGAAGACCGC GAGGACGTGT TTATCCGAGC GGCGAGTGAG 
CCGAAGTGGA AGGATGCCTA TTCCGGCCGC GATCCCGAAC CTGCCTTCCT GGTTCTGCAG 
GACGAGAGGG TTGTTTCCTA CGACTTAGCA AAAGCAGCGC CGCGATGGAA CGGGACGCAG 
TGGATGTATC CGCAAAGCGA GCTGATTTCA GATGACATGC AAGCCCTGAT AGGCCATCTG 
GTTGGATCTG GCGACGATTA CAAGAAGGCC TTTTGTCAGG CCGAGTACCG CATGGCGTTA 
GCTCACGTGT TCCTTACTAC TCGATCAAGC CGTCCCTCGG CAGGCAAGTA TTGCTATGCA 
GCCACGCGTG GTGGCGACAA GAACATGTGG CAAAAGGACT TCGAACTCAA CGGCGACCGT 
CAGGCGTGGC GTTGGTTACC GTCCCCTGAT GGAGAAGCAG ATCCTTTCGC CACAAAACTT 
GACGAACTCG CCACGGTCCT AGCCAGGCTG GAGCGCTGGT AA

Protein sequence

MTPRTIDPRI SLALSVQAQP GVYALLIGSG TSTGAGIPTG WGVIKDLVRQ AAAAEGTTLS 
ADPADEEIDE WWVNHGDGNE LGYSGLLESL GRTPAARSAL LHSYFEPNDE DRADNRKVPG 
KAHHAIAELV QRGAIRVILT TNFDSLIEQA LDQASVPYQV LSSESAIKAR KPLHHADCTV 
IKLHGDYKSL DQKNTLAELT DYGQATREIL HEVMENFGLI INGWSADWDK ALVEALEGRQ 
SRRYPLYWTT LYGPGPAAAA LIEQHGAAVI SGVTADEFFP DLQQRLESLD SLAAPQLTED 
MAIARLKRLL PYRESYIEIR ELLTSEIRTL ASYIRERGGS FPPGGDYATA FDNECLSLRN 
RSQTLIRLIA TGVAFDRDRI HGDLWVWAVQ QLMKARGQVS SFQEGWFNLA HYPALLALRA 
IAMIAVTEDR EDVFIRAASE PKWKDAYSGR DPEPAFLVLQ DERVVSYDLA KAAPRWNGTQ 
WMYPQSELIS DDMQALIGHL VGSGDDYKKA FCQAEYRMAL AHVFLTTRSS RPSAGKYCYA 
ATRGGDKNMW QKDFELNGDR QAWRWLPSPD GEADPFATKL DELATVLARL ERW