Gene Arth_1073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1073
Symbol
ID	4446444
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	1159075
End bp	1160508
Gene Length	1434 bp
Protein Length	477 aa
Translation table	11
GC content	64%
IMG OID	639688879
Product	band 7 protein
Protein accession	YP_830567
Protein GI	116669634
COG category	[S] Function unknown
COG ID	[COG2268] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.532983
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGGACT TGTCAGCATT CTTCCCGTTA ATTGCCGCTC TCATCGGGGC AATTGTTGTC 
ATCGGCTTTA TCTGGGTGGC AATAAAACTG ATGTGGAAAG TGGCTGAACC CAACGAGGCC 
CTGATCATCT CCGGCCTGAC CCGCGGAACC CTTGAAACGC GGGCCGGAAT GGACTTCAAG 
ATTGTCACGG GCAAAGGTGC GCTGGTGTTT CCCGGGCTTC AGACGGTACG GACCCTGTCC 
CTCACACTGA ATGAAACTGA GCTCAAAGTT TCCTGTGTTA CCTCGCAGGG CATCCAGGTA 
ATTGTGGAAG GTGTGGTGAT TTACAAGATC GGCGATGCCC CGCCCTTCAT TGCAAATGCG 
GCCCGGCGTT TCCTGGGCCA GCAGCCCAAA ATGGAAAGCC AGGTGTACAA CGTCTTTGAA 
GGGCACCTGA GGTCCATCAT CGGCAGCATG ACCATGGAGG AGATCATCCG CGAGCGGGAC 
AAGCTCGGTT CGCAGGTCCG CAGCGCCAGC GGTGTGGAAA TGGAGAAGCT GGGCCTGGTG 
GTGGATTCGC TCCAGATCAA GGACCTGCAG GACCCCACCG GCTATATCCA GAACATCGCC 
AAGCCGCACA TCGCCCAGGT GAAGATGGAA GCCCGCATCG CCGAGGCCAC CAGGAACCGC 
GAAGCGGCCG AGAAGGAAGC GGAGGCGGCG GCGCTCATCG CCGACGCTCA GAGCGTCTCC 
GCCATCAGGC AGTCGGTGGC GCAGGCCAAT GCCGAACGGG CGAAGGCCAA CGCCGCCCAG 
GCTGGGCCGC TCGCGGATGC GACGGCGCGG CAGCAGGTTG TGGTCCAGGA AACCGAGGTG 
GCCAAGCTCG AGGCTGACCG CGAAGAGCAG AAGCTCCAGA CCACCATCCG CAAGCCCGCC 
GACGCCAAGG CCTACGCCAA GCGCACGGAC GCCGAAGGCC AGAAGGCCGC GGACATCAGC 
GCCGCGGAAG CGCTGGCCCG CCGCACCGAA CTAGAAGCCC AGGTCAACGC CCGGCGGACG 
GAACTGCAGG CCCAGGCCAA TGCCACGGCT GCCGCGGCCG CGGCCGGCGC CACGAAGGTC 
ACCGGCGAGG CGGAAGCCGC AGCCACCCGG GCGCGCGGCG ATGCCGCCGC ATCGGCCATC 
AAGGCCAAGG CACTGGCGGA GGCGGAGGGC ATCAAGGCCC GCGCCGAGGC ACTCGGGACC 
AACCAGGATG CCGTCATTTC TCAGCAGCTG GCCGAGAACA TGCCCGCTAT CATCGCCGCG 
GCGGCTGAGC CGTTCTCGCA CGTGGGACAG ATGACTGTGC TCAACGGCGG GGAAGGCGTC 
AACAAGATGC TGGGCGGGAT TCTGGCCCAG GTGGGCGACT ACCTTCCGGC GCTCTCTTCG 
GCGCTGAAGA ACAGCAGGGA AGGCAAGCGG CCGGCGAAAG CCCCAGATGC GTAA

Protein sequence

MPDLSAFFPL IAALIGAIVV IGFIWVAIKL MWKVAEPNEA LIISGLTRGT LETRAGMDFK 
IVTGKGALVF PGLQTVRTLS LTLNETELKV SCVTSQGIQV IVEGVVIYKI GDAPPFIANA 
ARRFLGQQPK MESQVYNVFE GHLRSIIGSM TMEEIIRERD KLGSQVRSAS GVEMEKLGLV 
VDSLQIKDLQ DPTGYIQNIA KPHIAQVKME ARIAEATRNR EAAEKEAEAA ALIADAQSVS 
AIRQSVAQAN AERAKANAAQ AGPLADATAR QQVVVQETEV AKLEADREEQ KLQTTIRKPA 
DAKAYAKRTD AEGQKAADIS AAEALARRTE LEAQVNARRT ELQAQANATA AAAAAGATKV 
TGEAEAAATR ARGDAAASAI KAKALAEAEG IKARAEALGT NQDAVISQQL AENMPAIIAA 
AAEPFSHVGQ MTVLNGGEGV NKMLGGILAQ VGDYLPALSS ALKNSREGKR PAKAPDA