Gene Arth_3972 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3972
Symbol
ID	4447632
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4487146
End bp	4488375
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	69%
IMG OID	639691803
Product	HipA domain-containing protein
Protein accession	YP_833447
Protein GI	116672514
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID	[TIGR03071] HipA N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGCACC GCGTCGCCGA TGTCTACAAG GCCGGGGTGC TGGCCGCGCG GCTGGAGCGG 
CACGACGGCG GCACCAGGTT CAGTTACCTG CCGGCGTACC TCGCGGCGGG AGGTCCCGCC 
GTCGCCAGTT CCCTGCCGCT AAGCGCTGAA CCGGTGCTGT CCGCGGCGGG GGCCGCGCCG 
CCGTACTTCA CCGGGCTCCT GCCGGAGGGC AGGCGGCTGA ACGCGTTGCG ACGATCGGTG 
AAGACGAGCG TTGACGACGA ACTCTCGCTC CTGATCGCCG CCGGGGCCAA CCCGGTGGGC 
GATGTGCAGA TCGTTGGCCA CGGTGAGCCC CTGGACCCGG ACGAACACGC CGTCGAGCTC 
AACCCGAAGG CCCCGGTCGA CTTCGACGCG CTGCTGGGCG ACTCCGGGCT GATCGACCCC 
GTGGCGCTCG CTGGCGTGCA GGACAAGCTG TCCGCCGGGA TGATCTCCAT GCCCGTGGCC 
AGTGCCGGCC GGCGCTACAT CCTCAAGCTC AATGCCCCGG AGTTCCCGCA TGTGGTGGAG 
AACGAGCTGG TGATGTTCCG CTACGCCGCC AAGCTGCGGA TTCCGCTGAG CAAAGTGCGG 
CTGATACGGG ATGTAGAAGG CCGGCCCGGG CTCCTGGTGG AGCGGTTCGA CCGGATCCCG 
CTGGCGGGCG GCGCGCACGG AGCGGTGCAG CGGCTCGCCG TCGAGGACGG TGCGCAGGTG 
CTGGGGCTGT ACCCCGCGGA CAAGTACAAC GTGGCGTACG GGCAGGTGTG CCGCGCCCTG 
GCGGAGTACT GCGCGGCGCC GCTGCCTGCG CTGCGGAACC TTGCCATCCA GGCGGCGTTC 
GCCTGGCTGA GCGGGAACGG CGATCTCCAT GCGAAGAATG TGTCGATGGT GCAGCAGCCG 
TCGGGGGAGT GGTCCATCGC GCCGGTCTAC GACATCCCCT CCACAGTGGT CTACGGGGAC 
AAAACACTCG CCCTCACGCT GGACGGCAAA CGGACCGGGA TCTCGCGGAA GCATTTCCTG 
GGCTGGGCCG CCGGCCTGGG GCTGACGGAA CGCGCCGCCG TGCAGGTGCT GGAGCTGGGA 
TTGAAGGCAT CGGGTCCGCT GGTGGCCGAC CTTGAAGCGG GTACGGCTTT TGCCGGAGCG 
AACGACGACG GCGCCTCACC GTTTTCGTCG ATGGTCACCA GGTCATGGCT CAAGGAGCTC 
AAACACCGGC GCCGGCTGCT GGAAGCGTAG

Protein sequence

MRHRVADVYK AGVLAARLER HDGGTRFSYL PAYLAAGGPA VASSLPLSAE PVLSAAGAAP 
PYFTGLLPEG RRLNALRRSV KTSVDDELSL LIAAGANPVG DVQIVGHGEP LDPDEHAVEL 
NPKAPVDFDA LLGDSGLIDP VALAGVQDKL SAGMISMPVA SAGRRYILKL NAPEFPHVVE 
NELVMFRYAA KLRIPLSKVR LIRDVEGRPG LLVERFDRIP LAGGAHGAVQ RLAVEDGAQV 
LGLYPADKYN VAYGQVCRAL AEYCAAPLPA LRNLAIQAAF AWLSGNGDLH AKNVSMVQQP 
SGEWSIAPVY DIPSTVVYGD KTLALTLDGK RTGISRKHFL GWAAGLGLTE RAAVQVLELG 
LKASGPLVAD LEAGTAFAGA NDDGASPFSS MVTRSWLKEL KHRRRLLEA