Gene Arth_4224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4224
Symbol
ID	4443590
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008539
Strand	-
Start bp	57793
End bp	59025
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	66%
IMG OID	639687749
Product	hypothetical protein
Protein accession	YP_829446
Protein GI	116662393
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGAAT CAGACGGAAT AGATGAAGTT CTGGACGGCG GAATGCGGCA GTCCCTGATC 
ATCGCGTCCC GCATTGCCGA GACGCTGGCC CGTCGCCGGC AGGAGTCCCA GCGGCAGCAG 
GAACATCAGG ATGCCCAGGC AGCGCACGAA GCACAGGCAC GCCTCACGGC AGACCGCAGC 
GCGGCGCACG CCGCGCTGGC ACCGGTCAAT AGGGACCAGT GGTGGGACAA AGCCCAGCCC 
CACGACATTG CCACGGCACA TGCCGTCGCT GAAGGCTGGA AGGACCACGA CCCGACCGCC 
CTGGCGGCCT CGGAAAAGAT CCGTCAGGAA GTCTTCACGC GCTACGGCAT CGACACCCGC 
GACATCGGCG CGGGCGACGC CTACCTGGAG TCAGGGATCC GGACCGCCGC TACGGAAAAA 
GCCCGGCAGA GCGCACTGGA ACGCAGCCAG GAAGAAACAC GCACGGCGGC CGTCGAACAT 
GAGAAGGCCA TGGGCCTGCT CGCTGCTGCC CGTGTCGAAG AACTCCGCGC CCGGGCCGCG 
ACACTGGCCC CGGAAATGGA ACGCCACCAA GTGCCCATGG AGTACCTTGC CAACCCCGAG 
CTCGCCCGGG CATTGCAGAC GGCACACGCC GCGAAGACCC CCGCAGCAGT GGCAGCCGCC 
GACGCCACCG TGCAGGAACG CATGTTCCTC ATCGGCAAGG ACGGCATCAA CGGCCCCGAC 
ATCGACCAGC TCCGTGCGGA GACCACTGCG AACGTCAACG GTGCCAAGGA TTCACACTTC 
GAGGATCCCG CATTCGTCCA AGCAGCCAAG GACATGCACG AGGCCAAACT CCTGGCAGAG 
GGCGGTTTCA CAGGCACGGA GCGGACGCCC GTGGAGCAGC GGTACGAACG AGCCGAAAAG 
GAACTCTTTG CCCGCATGGA AAGCGTCGGC CGCGAAATCG AAAACCGCGT CACCGGCAAC 
GACAACAGCC GGCTAAAAGA CCAAGGGTTG AAGGCTGAAA GCACTTCTGC CGCGGACTAT 
GGATCAGCGG AGCGTCAGGA AGCATTCGCC GCGTCCCTGG CCACTACCGG CGCCAACGAA 
GTGCAAGTCC GGGGACGCGC CGCCGCAGAA CGCAGCGAGG GCACACACCC CCGCGCGGCC 
GTCACCATGG GCAAGGGCGC AGCCAAGGCC AAAAAGACCC GCACCAGCCT CTCGGCTAGC 
GCGAAGCGGT CCCAGAGCGG TCGCAGCCGA TGA

Protein sequence

MSESDGIDEV LDGGMRQSLI IASRIAETLA RRRQESQRQQ EHQDAQAAHE AQARLTADRS 
AAHAALAPVN RDQWWDKAQP HDIATAHAVA EGWKDHDPTA LAASEKIRQE VFTRYGIDTR 
DIGAGDAYLE SGIRTAATEK ARQSALERSQ EETRTAAVEH EKAMGLLAAA RVEELRARAA 
TLAPEMERHQ VPMEYLANPE LARALQTAHA AKTPAAVAAA DATVQERMFL IGKDGINGPD 
IDQLRAETTA NVNGAKDSHF EDPAFVQAAK DMHEAKLLAE GGFTGTERTP VEQRYERAEK 
ELFARMESVG REIENRVTGN DNSRLKDQGL KAESTSAADY GSAERQEAFA ASLATTGANE 
VQVRGRAAAE RSEGTHPRAA VTMGKGAAKA KKTRTSLSAS AKRSQSGRSR