Gene Achl_4478 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_4478
Symbol
ID	7280046
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011879
Strand	+
Start bp	413854
End bp	415038
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	64%
IMG OID	643580432
Product	protein of unknown function UPF0027
Protein accession	YP_002478246
Protein GI	219883082
COG category	[S] Function unknown
COG ID	[COG1690] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	75
Fosmid unclonability p-value	0.00757416
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTCCCCG TCGAAATGCG CGGCACAGCC CGTCCCGTTC ACCTCTGGGC GCACGAGCAC 
GAGGTTGAGC CCGCTGCCCT GCAGCAGCTG CGCAACATCG CCTCCATGGA ATGGGTTCAT 
GGCGTCCGTG TAATGCCCGA TGTCCATTTG GGCAAGGGGG CCACGGTCGG CTCGGTCATC 
GCCATGAAGC AGGCAGTATC GCCGTCCGCC GTCGGCGTGG ACATCGGCTG CGGCGTCTCC 
GCCGTCAAGA CATCACTGAC CGAGAACGAC CTGGACAACC TGCACGCGCT CCGGCTCGCC 
ATCGAATCCG CCATCCCGGT CGGCTTCAAC TCCCACAGCC GTGACGTGAA CCTGAAGCGC 
CTCGGCCTCG AGCGCGGTGC CAAGACGTTC TGGGACGGGT TCAAGGACCT CCACCCTGCA 
GTGCAGAAGC TGGAATCCCG TGCCCACTCC CAGCTCGGAA CCTTGGGCGG CGGAAACCAC 
TTCATCGAAG TCTGCGTCGA CGAGGCAGGC GCCGTCTGGC TGACCCTCCA CTCAGGCTCC 
CGGAACGTCG GCAAGTCCCT CGCTGAGGTG CACATCGACA TCGCCAAGGG CCTGAGCCAC 
AACAACGGCA TCGTCGATAA GGACCTGGCC GTGTTCCTGG CCGGCACACC CGAAATGGAC 
GCCTACCGCC GTGACCTGTG GTGGGCTCAG GACTACGCCG CCCGGTCCCG CTCGGTGATG 
ATGGGCCTGT TCAAGGAGCA GGTCGCCAAG CACTTCGCGA CGGCGAACGT CACGTTCGGC 
GAGGAGATCA ACGTCCACCA CAACTATGTC TCCGAGGAGA TCATCGACGG CGAACTCATG 
CTGGTCACCC GCAAGGGCGC CATCCGGGCT GGCAAGGGAA ACCTGGCATT GATCCCCGGC 
AGTATGGGCA CGGGCAGCTA CGTTATTCGC GGCCGCGGGA ACGACGCATC CTTCCAGTCC 
GCTTCCCACG GGGCTGGGCG GAAGATGAGC CGAAATGCGG CCAAGAAGGT GTTCACGGTC 
GATGACCTGA TTGCCCAGAC CGCCGGAGTC GAGTCCCGCA AGGACCAGGC CATCGTCGAC 
GAGATCCCCG GTGCGTACAA GGACCTGCAC AGCGTCATCG ACGCCCAGAA GGACCTGGTA 
GACGTCGTCC AGCACCTGCG GACTGTCCTC TGCGTGAAAG GCTGA

Protein sequence

MFPVEMRGTA RPVHLWAHEH EVEPAALQQL RNIASMEWVH GVRVMPDVHL GKGATVGSVI 
AMKQAVSPSA VGVDIGCGVS AVKTSLTEND LDNLHALRLA IESAIPVGFN SHSRDVNLKR 
LGLERGAKTF WDGFKDLHPA VQKLESRAHS QLGTLGGGNH FIEVCVDEAG AVWLTLHSGS 
RNVGKSLAEV HIDIAKGLSH NNGIVDKDLA VFLAGTPEMD AYRRDLWWAQ DYAARSRSVM 
MGLFKEQVAK HFATANVTFG EEINVHHNYV SEEIIDGELM LVTRKGAIRA GKGNLALIPG 
SMGTGSYVIR GRGNDASFQS ASHGAGRKMS RNAAKKVFTV DDLIAQTAGV ESRKDQAIVD 
EIPGAYKDLH SVIDAQKDLV DVVQHLRTVL CVKG