Gene Rcas_2290 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2290
Symbol
ID	5539771
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	2956290
End bp	2957477
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	61%
IMG OID	640894423
Product	PT repeat-containing protein
Protein accession	YP_001432391
Protein GI	156742262
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0125565
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATTCC GAAACAGATT TGCGATGGCT CATGCGCACC GCGCATGCAT ACTGCTTGGT 
CTTGTTCTGA CCATCAGTGC ATGTGGCGCG TCCAATCCTG CTGCGGCGCC GTCCGGGTCG 
CCAGCGGCAG CGCCGACCAC GGCGCCAACA ACGGCGCCGA CAGAGGCGCC GCCGACAGCA 
GTGCCGACCA CGGCGCCGAC TGATACGCCG CCAACCCCTG CCCCGACGGC GGTTCCGACC 
ATTGCCCCCA CCGTCGCGCC AACGGTTGTG ACGAGCGACC CGCTCACAGG TGCGCCAGCG 
CTGGCGCGAG GTGCGCTCCA GCAACGCCCG ATTGTGGTGA TGATCGATAA TCATCCGAAT 
GCGTACCCGC AAGCTGGTCT CGACAAAGCG GCTGTTGTTT TCGAGGCGCT GGCGGAATTC 
GGATTGACCC GCTTCATGGC GATCTATGCG CCAGGGATTA CGCCGGAGGC GACCTCGATT 
GGACCGGTGC GCAGTGCGCG GCTCTATTTT GTGCAGTGGG CAATGGAGTT TCGCGGTCTC 
TACGTCCATG CCGGCGGCGC GCCGCAGGCG CTCGAATTGT TGCAGAACAC GGCAAGTCTG 
GTCGATGTTG ATGCACTGTT CCGTGACAGG AGCGTCTACT TTACCCGCGT CAGTCAGCGC 
GCCGCTCCGC ACAATCTGTA CACCGACAGC GCCACACTCG AACGCGCGTT GCGCAGTCTT 
GCGCCAGAGC CGTTTGCCGA CCCGAATATT GGCTTTCTGT TCAAAACTGA TGCGCCGCTC 
GATGTGCGCC CTCCTTCCCG GCGGATTGAG TATTTTTTCA TCTATCGTGA AGATCCTGCG 
GGATGGACCT ACGACCCGAC GACGAACAGT TATTTGCGCT TGCGTCGGGG ACGCCCGGCT 
ATCGATGCAG TGACCGGGCA GCAACTGCGG GTGAAGAATG TGGTGGTGAT GGAAGTGCCA 
GAAGCGCCTA TTCCCGGTGA TGACAAGGGG CGGATCGAGC AGAAGGTGAT CGGCAGTGGA 
CGGGCGCGCG TGTTTCTGGA TGGCATCGAA CGCGAAGTGA CGTGGCGTAA AGACTCGCCT 
GATGATCGCC TGTTGTTCCT GGACGCTTCA GGCAATGAGA TTGCGTTCAA CCCCGGTCAG 
ATCTGGATTG TGGCGCTCCC ATCGCTCGAA AACCTGACCG TTTCGTAA

Protein sequence

MTFRNRFAMA HAHRACILLG LVLTISACGA SNPAAAPSGS PAAAPTTAPT TAPTEAPPTA 
VPTTAPTDTP PTPAPTAVPT IAPTVAPTVV TSDPLTGAPA LARGALQQRP IVVMIDNHPN 
AYPQAGLDKA AVVFEALAEF GLTRFMAIYA PGITPEATSI GPVRSARLYF VQWAMEFRGL 
YVHAGGAPQA LELLQNTASL VDVDALFRDR SVYFTRVSQR AAPHNLYTDS ATLERALRSL 
APEPFADPNI GFLFKTDAPL DVRPPSRRIE YFFIYREDPA GWTYDPTTNS YLRLRRGRPA 
IDAVTGQQLR VKNVVVMEVP EAPIPGDDKG RIEQKVIGSG RARVFLDGIE REVTWRKDSP 
DDRLLFLDAS GNEIAFNPGQ IWIVALPSLE NLTVS