Gene Rcas_3520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3520
Symbol
ID	5541019
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	4586180
End bp	4587322
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	64%
IMG OID	640895638
Product	hypothetical protein
Protein accession	YP_001433588
Protein GI	156743459
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATATTC CTATCAATTC CACCACCTGG AAGCGTCACC GCCGGCTGCT CCTCACTGCA 
CCGCTGGCGC TCGCCGCAGC CGCCGCTGAG TTCTGGGCAG TGCGCGCGCC ACGATCCCTG 
CACCTGCCGC CGCAACAACG GGTTGTGACG ATTAACCCGA AGATCGGCAT TCATACGCGC 
CTCACTGGCA TCGGCGACGA GGGGTATATC CGGCGCACGC TCGAACAGGT GCGTGAGATG 
GGCGCGCGCT GGATCGTTGA TCTCTTCCCT TGGGCATATG TGCAGCCGCG CTCGCGCTTC 
GGGTTCGACT GGACCGGCGC CGATCTGGTG GTGCGCCATG CGGCGCGTCA AGGGTTGCAG 
GTGATCGCCC GGCTCGACAT TGTGCCGCAG TGGGCGCGCC CGCGCGACTC GAATGACCGC 
TACCTCGACG AGGCGCACTA TGCTGATTTT GCCGCATATG CGGCGGCATT CCTTCGGCGC 
TACCGCGCCG ATGGCGTGCG CCACATCATC ATCTGGAACG AACCAAACCT GGCATTTGAG 
TGGGGACGAC GGACACCCGA TCCGGCCGGC TACGCCGCGT TGCTGAAGGC CGTTTACCCG 
CGCGTCAAAT CTGCTGTGCC CGATGCCGTT GTCATTGCCG GAGCGCTCTC ACCCGGCGGC 
GATCTTGGCG ACAATGCCGA GGTGCGAATG GGCGATCTGC GCTACATCAC CGAATTGTAC 
GCCGCCGGCG CTGCACCCTG GTTCGATGCC TGGGCTGTCC ACAACTATGG CGCGCAGCAA 
CCGCACGATG CGCCGCCAGC GCCGGAGGAG GTCAATTTCC GGCGCGTTGA ACTCATCCAC 
GACCTGCTCA CCTATCTGGG GGACGGACGC AAACCGATCT TCATTACCGA AGGGGGGTGG 
AACGACCACC CGCGCTGGTC AGCGGCGGTG CGCCCGTCGC AACGGGTGCG CTGGACGATT 
GGCGCGTACC GGATGGCGCT GGAATGGACC TGGCTGGAAG CAATGTGCCT CTGGCAGTTC 
AGCACCCCGT GGCAGGCGCG CACCTATCAG GATAACTGGA ACTTTGTTGC GGCTGATGGA 
ACGCCGAAGG CGATCTATTG GGCAGTGCGC GACTATGCCG TGCCGATAGA TCTGCGGCAA 
TGA

Protein sequence

MNIPINSTTW KRHRRLLLTA PLALAAAAAE FWAVRAPRSL HLPPQQRVVT INPKIGIHTR 
LTGIGDEGYI RRTLEQVREM GARWIVDLFP WAYVQPRSRF GFDWTGADLV VRHAARQGLQ 
VIARLDIVPQ WARPRDSNDR YLDEAHYADF AAYAAAFLRR YRADGVRHII IWNEPNLAFE 
WGRRTPDPAG YAALLKAVYP RVKSAVPDAV VIAGALSPGG DLGDNAEVRM GDLRYITELY 
AAGAAPWFDA WAVHNYGAQQ PHDAPPAPEE VNFRRVELIH DLLTYLGDGR KPIFITEGGW 
NDHPRWSAAV RPSQRVRWTI GAYRMALEWT WLEAMCLWQF STPWQARTYQ DNWNFVAADG 
TPKAIYWAVR DYAVPIDLRQ