Gene Acid345_4650 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4650
Symbol
ID	4070807
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	5507829
End bp	5508764
Gene Length	936 bp
Protein Length	311 aa
Translation table	11
GC content	61%
IMG OID	637986690
Product	hypothetical protein
Protein accession	YP_593724
Protein GI	94971676
COG category	[I] Lipid transport and metabolism [R] General function prediction only
COG ID	[COG1597] Sphingosine kinase and enzymes related to eukaryotic diacylglycerol kinase
TIGRFAM ID	[TIGR00147] lipid kinase, YegS/Rv2252/BmrU family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.303181
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGAAGG TCGCGCTCTT CTACAACCCG GCTTCAGGAC GCCGCAGTGC GCAACGCGCG 
CACGACGTGA AGATTGCGGC CGACGTCCTG CGCGCCGCCG GAAAACAAGT GCACGTGGAG 
CCCACGCGCG GCCCTGGCAC CGCAGCTGCG CAAGTCCACG AGGCCAAGGC ACAAGGCGCA 
GATACTGTCT TGATCGCAGG TGGTGACGGC ACCATCCATG ATGCCTTGCA AGGCTTGGCG 
GGATCGGACC TGACCCTCGG CGTGATTCCA ATGGGTACCG GAAACGTGCT GGCTCACGAC 
CTCGCGATTT CGCACCAGCC ACACGAGGCA GCCAAACAAT TGCTGGCCTT TCAGTCGCGA 
CGCATTGCGC TAGGCAAGGT GACCTATCGC GGGATCCGGG GACCGGAATC GCGATGGTTC 
GTTGCGGTGG CTGGCGTAGG CGGCTCCGCG AAGCTGATGT ACGACGTTCA CGCGGGTCTG 
AAGGGCGCGC ACGGAATGCT CGCGTATTAT GCGCAGATGG CGCGCCTGGC GTTGCTGCAT 
CGTTTCGATA GCTTCAACGT CGAATACCGC AGCGACGACG GCCAGTGGAT AAAGTGCACG 
GCGGTCGAAG CCGATGCGGT GCGCATCACA AATTTTGGTG GGCTGATGCG GCGCTGGGCC 
TGGGGTGCGA ACCTGCAACG TGATGACGCG CAACTGGTGC TCTTCCAAAC CGGCAGCCGT 
CCTCGCTTTC TGCATTACAC CTTCAGCAGG ATCCTGGGGA GACACTGGCA CACGCCCGGA 
GTGGAACTGA TCTATGCAAA AGAGATTCGG TGTACGGTAA GCAATCCGGC GCAGCGGCTA 
CACGTGGAAG CGGACGGCGA ATACATTGGC GGCCCTCCAG TAACGATTGA GGTTGTGCCG 
AATATGCTTA ATTTGCTGAT GGAGGCGAAA GGATAG

Protein sequence

MQKVALFYNP ASGRRSAQRA HDVKIAADVL RAAGKQVHVE PTRGPGTAAA QVHEAKAQGA 
DTVLIAGGDG TIHDALQGLA GSDLTLGVIP MGTGNVLAHD LAISHQPHEA AKQLLAFQSR 
RIALGKVTYR GIRGPESRWF VAVAGVGGSA KLMYDVHAGL KGAHGMLAYY AQMARLALLH 
RFDSFNVEYR SDDGQWIKCT AVEADAVRIT NFGGLMRRWA WGANLQRDDA QLVLFQTGSR 
PRFLHYTFSR ILGRHWHTPG VELIYAKEIR CTVSNPAQRL HVEADGEYIG GPPVTIEVVP 
NMLNLLMEAK G