Gene Sare_4080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4080
Symbol
ID	5705375
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4639479
End bp	4640429
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	69%
IMG OID	641273506
Product	diacylglycerol kinase catalytic region
Protein accession	YP_001538861
Protein GI	159039608
COG category	[I] Lipid transport and metabolism [R] General function prediction only
COG ID	[COG1597] Sphingosine kinase and enzymes related to eukaryotic diacylglycerol kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0295427
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGCTG TCCTGGTGGT CAACCCCAAG GCCACCACCA CCAGCGAGCG CAGCCGGGAC 
GTCTTGGTCC GGGCGCTGCG CAGCGAAGTT GACCTGTCGG TGCGGTACAC CCGGCGCCGG 
GGGCACGCCA CCTCGTTGGC CCGGGAGGCA GCCGAGGAGG GTGTGGACCT GGTCGTCACG 
CTCGGTGGTG ACGGCACGGT CAACGAAGTA GTCAACGGCC TGATGTCCGC CCGGCCGACG 
ACTACGCCGG CCGGGCAGCC GTCGGCTGAC CAGCTGCCCG CTCTGGCAAC CGTGCCGGGC 
GGCTCGACCA ACGTCTTCGC CCGCGCGCTC GGCCTGCCCC GGGAGTGGCC GGACGGCGCC 
AGCATGATCC TGGAAGGGCT GCGGCTGGGC CGACACCGCA CCATCGGCCT GGGCCGGGCG 
GACGACCGCT ACTTCACCTT CTGCGCCGGC TTCGGAATCG ACGCCGCGGT GATCCACCGG 
GTGGAGCGGT CACGTCGGCG AGGGCAGGTC TCCACGCCCG GCCTGTACTT CCGGTCGACC 
CTCGCCCAGT ACTTTCTCGC CTCAGACCGT CGGCACCCTG CCATCGCCCT CCAGCGGCCG 
AGCGAACCCA CCGAGGAGCA GCTCGCCACC GTCATCGTGC AGAACACCGC ACCCTGGACG 
TACCTCGGCG AGCAGGAGGT GAACCCGAAC CCGGAGGCGT CGTTCGATCT CGGACTGGAC 
GCGTTCGCGC TACGACAGCT TCGGGTGACC AGTACGACAC GGACAATCAC CCAGTTCTTC 
GGCCGGCAGC CGGGTCCACA CGGCAAGCAG GTACTCCGAC TCCACGATCT GAACGAGTTC 
ACCCTGGTTG CCCGCCGTCC GCAGGCGTTC CAGATCGACG GCGAGTACCT GGGCGAGCGG 
GAAAAAGTCG AATTCGCCGC CGTACCCGCC GCCGTACGAG TAATCTGCTA G

Protein sequence

MRAVLVVNPK ATTTSERSRD VLVRALRSEV DLSVRYTRRR GHATSLAREA AEEGVDLVVT 
LGGDGTVNEV VNGLMSARPT TTPAGQPSAD QLPALATVPG GSTNVFARAL GLPREWPDGA 
SMILEGLRLG RHRTIGLGRA DDRYFTFCAG FGIDAAVIHR VERSRRRGQV STPGLYFRST 
LAQYFLASDR RHPAIALQRP SEPTEEQLAT VIVQNTAPWT YLGEQEVNPN PEASFDLGLD 
AFALRQLRVT STTRTITQFF GRQPGPHGKQ VLRLHDLNEF TLVARRPQAF QIDGEYLGER 
EKVEFAAVPA AVRVIC