Gene Achl_1333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_1333
Symbol
ID	7292780
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	+
Start bp	1488170
End bp	1489501
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	68%
IMG OID	643589739
Product	protein of unknown function DUF58
Protein accession	YP_002487412
Protein GI	220912103
COG category	[R] General function prediction only
COG ID	[COG1721] Uncharacterized conserved protein (some members contain a von Willebrand factor type A (vWA) domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0000000419931
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCCACCG GCACCCCGCT GACCCGGCTC ACGGAGCGTC TCAAGCAACC CTTCCACCGG 
GACGGCAGGC CCACCCGCCT GCACCCTTCG GCGGTCTGGG CTGAGGCAAG CTCCACTGCA 
GGCCTTGCCC TGGAACCGGC CTGGCGCACC GTCCGGAAGG CGTGGCTCAC CTACGTCTGG 
CCGGTGCTCT CCGTGGTCAG CGTGCTGGGA TGGTCCGTTC TTGCAGCCAC CATCCTGCTC 
TGGTGGGCAG GATCGGCCTA CGGCTGGCAG GAAGCGAAGG CCGCTGCCGT GGCGGCCTTC 
GTCATGTTCC TCATCGCGGT GTGCTTCATC CTGGGCCGCT CCACCTACGG GGTGGTCCTG 
GACCTGGCAC GGACCCGCGT GGCGGTGGGG GACAGCGCAG TGGGAAGCAT CGCCGTCACC 
AACACGTCCA GCCGCCCGCT GCTGCCGGCA TCGGTCGAAC TGCCCGTGGG TGGCGTCACG 
GCCGTCTTCC ACCTGCCCCG CATGAAGCCC CAGCAGGTCC ATGAAGACCT CTTCACCATT 
CCGACGGCAC GCCGCGCCGT CATCGTGGTG GGTCCGGTCC GTTCCGTGCG GGCCGACCCC 
CTGCACCTGC TGCGCCGCCA GGTCCTGTGG ACCGAGCCCG AGGACCTCTT CGTCCACCCG 
CGTACGGTGG CGCTGGCGGG CTCAGCCGCC GGGTTCATCC GCGACCTCGA AGGCATGCCC 
ACCACGGAAC TGTCCAGTGC CGATGTCTCC TTCCACGCCC TCCGTGATTA CGTCCCGGGC 
GATGACAGGC GCCACATCCA CTGGAAGACC ACTGCACGGA CCAACAAACT GATGGTGCGC 
CAGTTCGAGG AAACCCGCCG GGCACACCTC GCCATCGCAC TGTCCATCAA CACCGATGAA 
TACGCCTCCG AGGAAGAGTT CGAGATGGCC ATTTCGGCGG CCGCTTCGAT CGGCCGCCAG 
GCCATCCGAG AGCAGCGTGA GCTGGATGTC CTGACGCAAA AGGGGCCGCT GCGCTGCGAA 
ACGGGCCGCA ACATGCTCGA TGACATGACC CGGATCGTCG GCACCCCGAT GCGCCGCACC 
GCCGTCGACC TCGCCCGTAC TTTGGCGGAC ACCGTCCCCA ACGCCTCCGT AGTGTTCTTC 
GTGGTGGGCA GCAACGTCAC AGCCACCCAG CTGCGCTCCT CCGCGGCCTC CGTCCCGCCG 
GGCGTCCGCA GCCTCGCCGT CCGGATCGAG GCCGGGGCCG CGTCCAGCAG GGCCAACATC 
GCAGACCTCA CCGTGCTGAC CGTCGGCGAC CTCGCCGATC TCGGCATCGT CCTCCGAAAG 
GCGGCAGCAT GA

Protein sequence

MSTGTPLTRL TERLKQPFHR DGRPTRLHPS AVWAEASSTA GLALEPAWRT VRKAWLTYVW 
PVLSVVSVLG WSVLAATILL WWAGSAYGWQ EAKAAAVAAF VMFLIAVCFI LGRSTYGVVL 
DLARTRVAVG DSAVGSIAVT NTSSRPLLPA SVELPVGGVT AVFHLPRMKP QQVHEDLFTI 
PTARRAVIVV GPVRSVRADP LHLLRRQVLW TEPEDLFVHP RTVALAGSAA GFIRDLEGMP 
TTELSSADVS FHALRDYVPG DDRRHIHWKT TARTNKLMVR QFEETRRAHL AIALSINTDE 
YASEEEFEMA ISAAASIGRQ AIREQRELDV LTQKGPLRCE TGRNMLDDMT RIVGTPMRRT 
AVDLARTLAD TVPNASVVFF VVGSNVTATQ LRSSAASVPP GVRSLAVRIE AGAASSRANI 
ADLTVLTVGD LADLGIVLRK AAA