Gene Achl_2998 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_2998
Symbol
ID	7294478
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	-
Start bp	3343097
End bp	3344272
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	64%
IMG OID	643591408
Product	flagellin domain protein
Protein accession	YP_002489048
Protein GI	220913739
COG category	[N] Cell motility
COG ID	[COG1344] Flagellin and related hook-associated proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.00055355
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGGAATGC AGATCAACAC CAACCTGGCT GCGAACAACG CTTACCGCAG CCTCAGCAAC 
ACCCAGAACG ACCTGTCCAA GTCACTGGAG AAGCTCTCCA GCGGCCTGCG CATCAACCGC 
GCCGGTGACG ACGCGGCCGG CCTGGCAATC TCGGAAAGCC TGAAATCCCA GATCGGCGGC 
CTGAACGTTG CTTCCCGCAA CGCCCAGGAC GGCATCGGGC TGGTGCAGAC AGCGGAAGGC 
GGCCTCAGCC AGGCACATTC CATCCTGCAG CGCCTGCGCG ACCTGGGCGT CCAGGCCGCG 
AACGACACGA ACAACACTGA CTCGCGGGCA GCCATCAAGA CCGAAGCCAC CAGCCTGGTC 
GAGGAACTGG GCCGCATCGC CGGCTCCACT GACTTCAACG GCACCAAGCT GCTGAACGGT 
GACAACGCTT CCCTGAAGAT CCAGGTTGGT GCCAACGGTG ATGCTGCCAG CCAGATCGGC 
GTGGACCTTT CCGGTGCCAA CGTCAAGGCG ATTGCCAACA CGCTGAACCT CGGTGCGCTG 
GCCAGTGGCG GCAGCAAGTT CGACATCGCC GACGCCACAG CGCTTGCCGG CGCAGCGACC 
TTCAGCTCCA CCAAGGATGG CGTGGTGACC ACGGTTACCA CCGCAGACCT CGGTGCAGCC 
GGTTCCTTCA CCAGTGTCGA AGGCTACGCC GACGCACTGC GCAAGGATGC CGACTTCTCC 
TCGAAGTTCA CGGTGTCAGT GGAGAAGGAT GCCAATGGCG CGGGCACGGG AATCGTGGTC 
CAAGCCAAAG ACGGCGGCGA CCTGCTGGAC GCTGACAACG CAACCGCGGG TACGGGCCTC 
GCTGCCGGTG CCGCGACCGC GTCGGTGGCA ACCGGACTGG ACTTCTCCAA CGCGTCCAAG 
GCCCAGGCAT CAATCACCCT GATCGACACC CAGATCAAGA ACGTCTCCAC TGCCCGTGCA 
GACCTGGGCG CAACCCAGAA CCGCCTGGAA TCCGCTGTGC AGACCATCAA CGTGGCCAAG 
GAAAACCTGA CCGCATCCAA CAGCCGGATC CGCGACACGG ACATGGCCGA GGAAATGGTC 
AAGTTCACCC GCAACAACAT CCTGTCCCAG GCCGGAACCG CAATGCTCGC GCAGGCCAAC 
CAGTCCAGCC AGGGTGTCCT GCAGCTGCTG CGCTAG

Protein sequence

MGMQINTNLA ANNAYRSLSN TQNDLSKSLE KLSSGLRINR AGDDAAGLAI SESLKSQIGG 
LNVASRNAQD GIGLVQTAEG GLSQAHSILQ RLRDLGVQAA NDTNNTDSRA AIKTEATSLV 
EELGRIAGST DFNGTKLLNG DNASLKIQVG ANGDAASQIG VDLSGANVKA IANTLNLGAL 
ASGGSKFDIA DATALAGAAT FSSTKDGVVT TVTTADLGAA GSFTSVEGYA DALRKDADFS 
SKFTVSVEKD ANGAGTGIVV QAKDGGDLLD ADNATAGTGL AAGAATASVA TGLDFSNASK 
AQASITLIDT QIKNVSTARA DLGATQNRLE SAVQTINVAK ENLTASNSRI RDTDMAEEMV 
KFTRNNILSQ AGTAMLAQAN QSSQGVLQLL R