Gene Achl_2091 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_2091
Symbol
ID	7293552
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	-
Start bp	2355566
End bp	2357116
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	63%
IMG OID	643590490
Product	band 7 protein
Protein accession	YP_002488149
Protein GI	220912840
COG category	[S] Function unknown
COG ID	[COG2268] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.0000000648722
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATTATTG GGGGAACCAT GGTGATCGTC CTGATCGCCG CAGCTGCAGT GGTGGTGCTG 
CTCATCGCCG GATTCATTTT CTATACCAAG AGCATCCGGT TCGCCAAGCC CAACGAGGCG 
ATGCTGATTA CCGGCAAGAG CGATCCGAAC ACAACGAACG AAACTTCCGA TGACCAGTCG 
CGGGTCATCA TCAACAACAG GGCATTCGTC AATCCCATCA CCGAGCGCGT CAGCCACATC 
TCGCTGTCCT CGCGCCAGGT TGAGGTGACC ATCGAGGCCA TTTCGAACAA CGGCATCCAG 
CTCAAGCTGA CTGGTGTTGC CCAGGTCAAG GTCGGGGGCG ACAAGGTTTC GGTCCGCAAG 
GCCGCCCAGC GGTTCCTGGA CCAGCAGGAC GCCATTGACC ACTACACGCA GGAAACCCTG 
TCTGGCTCCC TGCGCTCGAT CGTCGGCACG CTGAGCGTTG ATGCGATCAT CAAGGACCGC 
GCGCAGTTCG CGGCCTCCGT CAAGGAGGAG GCCGAACACT CCATGACCAA CCAGGGCCTG 
GTGATCGACA CCTTCCAGAT CAAGTCCGTG GACGATACCG GCGGCTACCT GAAGAACCTG 
GGGCGTCCCG AAGCTGCGCT GGTGGCCCGG AACGCGAGCA TCGCCGAGGC CAATTCGCAG 
CGCGAGGCCG CGGAGGCGAA AGCCCTTGCG GACCAGAAGA CGGCTGAGGC GGAGCAGAAG 
CTGGCGCTCC GCCGCGCCGA ACTCAAGCAG GAAACCGATG CCCGCCAGGC TGAGGCCGAT 
GCTGCCGGGC CGCTGGCCCA GGCTGACCAG CAGGAAGCGA TCATCCTGAA GAACCAGCAG 
GTGGTGGCAC GCCAGGCGGA ACTCCGTGAA AAGGAACTCG ACATCGAGGT CCGCAAGCCC 
GCCGATGCCG CCAAGTACAA GGTGGAAACG GAAGCTGCAG CGGATGTGTC CCGCCGTACC 
CGGATCTCCG AAGCAACCAA GGTGGAGGCA GCCGCCGAAC TGGAAACCAG GAAACTGCGG 
GCTGCCGGCA ACGAGGTGGA AGCCCAGGCG CTGGCTGCCG CCAACACGGC CAAGGGAAAC 
GCGGAAACGG AGATCAACAA GATCCGCGGC CTGGCCGAGG CGGAAGTCAC CAAGTCGCAG 
GGTATTGCCG AAGCGGATGT CATCGGACTG CGGGGCAAGG CCGAAGCGGA AGCCATCGAA 
GCCCAGGCCA AGGCGTACAG CGAGTTCAAC GAGGCAGCCA TCCTGAACAA GCTGCTGGAA 
GTCCTGCCGT CCATCGCGAA GGAAATCGCG GCCCCGATGG GTGCCATCAG CAACATGACG 
GTCATCTCGA ACGACGGCGC CGGACAGGTG AGCAGGAACG TCTCCTCGGG CGTGCACGAA 
ACAGCCCAGC TCCTCAAGGA CACCACCGGC TTTGACGTCA TCCAGATGCT GAAGGGCTTC 
GGCCAGACGT CGGCAACGCC AACAGCCGGC ACGTCCGCGA CGTCCGTTGG TTCAGCAGGC 
AACGGCAAGT CGCCGGAGCA GGCCACACCG CAGGGCCCCG GGCAGGACTA G

Protein sequence

MIIGGTMVIV LIAAAAVVVL LIAGFIFYTK SIRFAKPNEA MLITGKSDPN TTNETSDDQS 
RVIINNRAFV NPITERVSHI SLSSRQVEVT IEAISNNGIQ LKLTGVAQVK VGGDKVSVRK 
AAQRFLDQQD AIDHYTQETL SGSLRSIVGT LSVDAIIKDR AQFAASVKEE AEHSMTNQGL 
VIDTFQIKSV DDTGGYLKNL GRPEAALVAR NASIAEANSQ REAAEAKALA DQKTAEAEQK 
LALRRAELKQ ETDARQAEAD AAGPLAQADQ QEAIILKNQQ VVARQAELRE KELDIEVRKP 
ADAAKYKVET EAAADVSRRT RISEATKVEA AAELETRKLR AAGNEVEAQA LAAANTAKGN 
AETEINKIRG LAEAEVTKSQ GIAEADVIGL RGKAEAEAIE AQAKAYSEFN EAAILNKLLE 
VLPSIAKEIA APMGAISNMT VISNDGAGQV SRNVSSGVHE TAQLLKDTTG FDVIQMLKGF 
GQTSATPTAG TSATSVGSAG NGKSPEQATP QGPGQD