Gene Arth_2373 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2373
Symbol
ID	4444987
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	2660902
End bp	2661978
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	69%
IMG OID	639690181
Product	hypothetical protein
Protein accession	YP_831852
Protein GI	116670919
COG category	[R] General function prediction only
COG ID	[COG1721] Uncharacterized conserved protein (some members contain a von Willebrand factor type A (vWA) domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCATCGT GGCGTCCGTC CAGACTCCCT GAGCGCGCCC GCATGGCCAG CCTCCTGACC 
CGGGTGAAAT CTAAAATGTC GATCTTCGCC CACCGCAAGG CACGCGGGAT GCTCGACGGC 
GAATACGGTT CCGTTTTCAA GGGGCGCAGC CTGGACTTTG ACGACCTCCG TGCCTACATT 
CCCGGAGACG AAGTCCGCGA CATCGACTGG AAAGCCTCTG CCCGGCACGG ATCCCCGCTC 
ATCAAACGCT ATGTTGCAGT GCGGCGGCAG ACAGTGCTGC TGGTCACGGA TACCGGACGC 
AACATGGCTG CTTCCTCGCT CGGCGGCGAG GAGAAGAAGG ACATTGCCGT GATGGCCCTG 
GGCGTGGTGG GCTACCTTGC CCACCGTCAC GGCGACGTAG TGGGGCTCGT GTGCGGCGAC 
GGGACGTCGA CCCGGTCGCT GCCCGCGAAA GCCGGCGAGG CCCACCTGGA AAGGCTTCTT 
CGCGAAGTCG ACGGGGCCAC GGCGCTGGCC TCGCCCCGAA GCAACATCAG CGAGCAGCTC 
TCCTATGTGG CACGCAACTT CGGCCAGCGC ATGCTGCTCT TCGTTGTGGC CGACGAGCTG 
GTGCCGGATG CCGGGATGGA GCGGCTGCTG CGGCGGCTGC GCGCGCAGCA CGAAGTCCTC 
TGGCTGACCG TCCGCGACGC GCAGTTGGCC GGACCCGCCG CCGGACCGAA CCCCGCCGGA 
CCCGCCGCCG GACCGAACCC CGCCGGACCC GCCGCCGGAC CGAACCCCGC CGGACCCGCC 
GCCGGACCGA ACCCCGCCGG ACCCGCCGCC GGACCGAACC CCGCCGGACC CGCCGCCGGA 
CCGAACCCCG CCGAACCCGT CGACCGCTAC GACGTTGCGG ATGCCGGCTT CCTTCCCGGA 
CGCCTTGCGG CGTCTGATGC CATCATCCGG GCCTATGCCG CGGCGCAGGA GCAGCGCGAT 
GCCGCCCGGG AGGCTGTGCT GCGGCGGATG GGCATTGCCC ACGTCGATGC GGGCAGCAGC 
CATGATGTGA TGCCTGCGGT GTTCACCCTG CTGGAACGGC ACCGCCGTGG GAAATGA

Protein sequence

MPSWRPSRLP ERARMASLLT RVKSKMSIFA HRKARGMLDG EYGSVFKGRS LDFDDLRAYI 
PGDEVRDIDW KASARHGSPL IKRYVAVRRQ TVLLVTDTGR NMAASSLGGE EKKDIAVMAL 
GVVGYLAHRH GDVVGLVCGD GTSTRSLPAK AGEAHLERLL REVDGATALA SPRSNISEQL 
SYVARNFGQR MLLFVVADEL VPDAGMERLL RRLRAQHEVL WLTVRDAQLA GPAAGPNPAG 
PAAGPNPAGP AAGPNPAGPA AGPNPAGPAA GPNPAGPAAG PNPAEPVDRY DVADAGFLPG 
RLAASDAIIR AYAAAQEQRD AAREAVLRRM GIAHVDAGSS HDVMPAVFTL LERHRRGK