Gene Arth_0967 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0967
Symbol
ID	4446525
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	1040260
End bp	1041225
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	68%
IMG OID	639688773
Product	hypothetical protein
Protein accession	YP_830464
Protein GI	116669531
COG category	[I] Lipid transport and metabolism [R] General function prediction only
COG ID	[COG1597] Sphingosine kinase and enzymes related to eukaryotic diacylglycerol kinase
TIGRFAM ID	[TIGR00147] lipid kinase, YegS/Rv2252/BmrU family

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.273578
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCCACA TGAAAGCCGC CCGGGACGCC CGCTCTGCCG CCGTCGTCAT CAACGCCGGA 
TCACGCCGAG GTGCTGCAGG CGAACTTGCG GTGGACGCGA TGAAAAAGGC AGGCGTGCCC 
ATCACCGCCG TGAACCACAT CCTGTCCGGG GCAGACCTGG CCGGGACACT TGACCGGGTG 
CTTGCGGACG GGCACGACCT GGTGGTTGTC GGCGGCGGCG ACGGGACCGT GTCCTGCGCC 
GCCGGCCGGG TTGCCGGCAC CAACGTTGTG CTTGGCGTCC TTCCGCTGGG CACCGCGAAC 
GACTTCGCCC GCACGCTGGA GATACGGAAC AACATTGTCG AGGCGTGCGC AACCGTCGCC 
GAAGGAAAGG TGGTGGATAT TGACCTCGGC CGGGCCAACG GTGAGCCGTT CCTCAACGTC 
GCGTCCGTGG GCCTGTCCGT GGCTGTGACG GAGGCTCTGA GCCCCCGCTT GAAGCGGTAC 
ATCGGACCAT TGGCATACAG CATCGCCACG CTGCGGGCCT ATGCCCGGCA CAAGCCGTTC 
CGGGCCCGCC TCGAGTTCCC CGAGGGCGAC CACGAGCCGA TGGAACTGGA AGACCTGCTT 
CAGGTGGCGG TCGGCAACGG CCGGCATTAC GGCGGCGGCA ACACGGTCTC CCCCACCGCC 
GGGATCGATG ACCACCTCCT GGACATCTAC GCCATCCTGG CGGGTCCGCT CCGGGAGCAC 
GTGAGCATCG CAAGGCTGCT GAAGGATGGA AGCTTCATCG AGCACGACAA GGTGTACCAC 
CTGACAAGCC GGCACGTTCG GCTGGTCACC GATCCGCCGC TGCCGGTGAA TCTCGACGGC 
GAGATCGCCA CCATCACGCC AGCCGACTTC ACCGTCCAGC GCAACGCCGT CCACGTGCTG 
GTGCCCCAGA GCAGCACCAG CGCCCTGTTG GACGGACCGG GCGCCGCGAG CGGGCCGCCG 
TCGTGA

Protein sequence

MAHMKAARDA RSAAVVINAG SRRGAAGELA VDAMKKAGVP ITAVNHILSG ADLAGTLDRV 
LADGHDLVVV GGGDGTVSCA AGRVAGTNVV LGVLPLGTAN DFARTLEIRN NIVEACATVA 
EGKVVDIDLG RANGEPFLNV ASVGLSVAVT EALSPRLKRY IGPLAYSIAT LRAYARHKPF 
RARLEFPEGD HEPMELEDLL QVAVGNGRHY GGGNTVSPTA GIDDHLLDIY AILAGPLREH 
VSIARLLKDG SFIEHDKVYH LTSRHVRLVT DPPLPVNLDG EIATITPADF TVQRNAVHVL 
VPQSSTSALL DGPGAASGPP S