Gene Rcas_2072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2072
Symbol
ID	5539552
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2657757
End bp	2658893
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	62%
IMG OID	640894207
Product	hypothetical protein
Protein accession	YP_001432176
Protein GI	156742047
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCTCA TACCAACGGA AACCATTGCG GCAATCCACG ATACGCCGCA CCGACTGGTG 
TTCGAGTTCG CCGGCGCCGG CAGCCTGGCG CTCTATTGGC TGCACAGCGT GCCTGGCTCA 
TCGCGCACTG TGCTGGAAGC GACCGACCGG TACGCAGCGA CATCGCTCAC CGACCTGATC 
GGCAAGACGC CGGAAAAGTT TGTTTCTGCC GACACGGCGC GCATCATGGC TGAGATGGCG 
TACCGCCGCG CCATGCGCCT GACCGACGGC GCCGCTGCGT GCCTCGGAGT CGCCTGCACC 
GCCGCGATTG CCACCGATCG CGCCAAACGC GGCGCGCACG GCTGTTCTAT TGCCGTGTAC 
GACGGCACAA CGATGCGCGC GTTCAACCTG ACGCTCGCCA AAGGCGCGCG CGACCGCGCC 
GGCGAGGAAC AGGTGATCAG CCTGCTGATT ATACGCGCAA TCGCCAGCGC TTGTGGCGTC 
GCTGCGCCCG ATCTTGCGCT GGAACCTCCC GAAACGCTGG AGGTGGATGA GGAGACGCGA 
CCCGATCCGC TGACGCTTCT TGTGCAGGGG GATGTCGAAG ACGTTTTTAT CGACATCGAT 
GGGCACGCAC ATCTGAAAGG GACACCGCCG GTCGCACTGC TGTCCGGTTC GTTCAACCCG 
CTCCACGCCG GGCACGAACA ACTGGCACAA GCAGCCGCAG CCTTCCTGCG CGTACCGGTT 
GTTTTTGAGC TCCCCATTCT GAACGCCGAC AAGCCGCCAC TCGGATATGC CGAACTGGAA 
CGCCGCCTGG AGCAGTTTCG CGGACGTTAC CCCGTCGTGC TCAGTCGCGC ACCGCTCTTT 
GTGCAAAAAG CGAACCTGTT TCCAGGATGC ACCTTCGTCA TCGGATACGA TACCGCAATT 
CGAATCATCG ATCCGCGCTA CTACGATGGC GAAGCCGGAC GCAACGCCGC CTTCGCCGCT 
ATCGCCGCCC ATGGATGCAC ATTCCTGGTC GCCGGGCGTA TCAAGGATGG CGTCTTCCGT 
ACCCTGGCAG ATATCGACCT GCCGGCTTCA TTGCGTCCAC TCTTCCGTGA ACTGCCTGAG 
CGCATATTCC GCGTCGATCT CTCCTCGAGC GCCATCCGCA ACGCTTATGG CACATAA

Protein sequence

MNLIPTETIA AIHDTPHRLV FEFAGAGSLA LYWLHSVPGS SRTVLEATDR YAATSLTDLI 
GKTPEKFVSA DTARIMAEMA YRRAMRLTDG AAACLGVACT AAIATDRAKR GAHGCSIAVY 
DGTTMRAFNL TLAKGARDRA GEEQVISLLI IRAIASACGV AAPDLALEPP ETLEVDEETR 
PDPLTLLVQG DVEDVFIDID GHAHLKGTPP VALLSGSFNP LHAGHEQLAQ AAAAFLRVPV 
VFELPILNAD KPPLGYAELE RRLEQFRGRY PVVLSRAPLF VQKANLFPGC TFVIGYDTAI 
RIIDPRYYDG EAGRNAAFAA IAAHGCTFLV AGRIKDGVFR TLADIDLPAS LRPLFRELPE 
RIFRVDLSSS AIRNAYGT