Gene Rcas_4058 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4058
Symbol
ID	5541569
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	5266803
End bp	5267873
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	61%
IMG OID	640896170
Product	putative virion core protein (lumpy skin disease virus)-like protein
Protein accession	YP_001434108
Protein GI	156743979
COG category	[S] Function unknown
COG ID	[COG4260] Putative virion core protein (lumpy skin disease virus)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.13522
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0384767
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACTGC TCGACATTGT TGAATTCGTC GATCCTACGG GCAAAACGCT GGTTGCGCGC 
GTTCCGCCGG ACGGCAATGG CGAATTGCGT CTCGGTTCTC AGTGCATTGT GCGCGAAGGG 
CAGCTCGCTT TCTTTGCGCG TGACGGGCGT TTCCTCGATA TGCTCATTCC GGGGCGGCAC 
ACGTTGACGA GCAACAACAT TCCGCTGCTG ATCGACTTCA TCAAACTGCC GTTCGGCAGC 
AAAAGCCCAT TCCGCGCCGA TGTCTACTTC GTCAGCCTGC ACCAGCACAC CGATCTGAAA 
TGGGGAACGC CGCAACCAAT CCCGATGCGC GATGCGCAGT TCGGCATGGT GCGGTTGCGG 
GCGTTTGGCA CATTTATCAT CCAGGTAGCC GAACCCCGCC GCTTGCTCAC TGCCGTGGTC 
GGCACCCGCG GTCGCCTGAC AGTCCAGGAT GTCGAGGAGC AACTGCGCAG TTCGATTATT 
GCGCGCGTTG CTGATGTCAT TGCCGAGCGC ATGCGTGAGC GTCAACTCTC GGTGCTCGAC 
CTTGCGACCG AGTATGATGA ACTCTCGGAA ATGGCGCACG AAGTGTTGAA GGACGACTTT 
GCCGCGCTTG GCTTGCAGTT GACGCGCTTC TACATCAACA CCATCAGCGT GCCCGAAGAA 
CTCGAGCGGC GGCTCGATCA GGTCGGCGGC GTGGCAGCGT TTGGCGGATT GGGCGACTAC 
ACGCGCTTCA AGGCGGCTGA AGCGCTACAC GATGCCGCGC GCACCGGAGG CGACAGCACC 
GTCGGCGCAG GCATCGGGCT GGGTGCGGGA ATGAACCTTG GGGCGCTCAT GGGTCAGGTT 
CTTCAGCAGC AGACGCCGAC ACAATCGCCG CCACAGCCAG CGCCGATAAC GGCGACATCC 
TCACAGGCGG CAACGAAGAC ATGCCCGCGC TGTAACACGG CTATGCCTGC GAACGCCAGG 
TTTTGCAGCG AGTGCGGCGC GTCGCTCCTA CCGGCGACAT GCCCGCAATG TGGACATGCA 
GTGACGACTG GGGCGAAGTT CTGCATCGAA TGCGGTGCGG CGCTGAAATA A

Protein sequence

MPLLDIVEFV DPTGKTLVAR VPPDGNGELR LGSQCIVREG QLAFFARDGR FLDMLIPGRH 
TLTSNNIPLL IDFIKLPFGS KSPFRADVYF VSLHQHTDLK WGTPQPIPMR DAQFGMVRLR 
AFGTFIIQVA EPRRLLTAVV GTRGRLTVQD VEEQLRSSII ARVADVIAER MRERQLSVLD 
LATEYDELSE MAHEVLKDDF AALGLQLTRF YINTISVPEE LERRLDQVGG VAAFGGLGDY 
TRFKAAEALH DAARTGGDST VGAGIGLGAG MNLGALMGQV LQQQTPTQSP PQPAPITATS 
SQAATKTCPR CNTAMPANAR FCSECGASLL PATCPQCGHA VTTGAKFCIE CGAALK