Gene Rcas_0452 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0452
Symbol
ID	5537915
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	570937
End bp	572958
Gene Length	2022 bp
Protein Length	673 aa
Translation table	11
GC content	62%
IMG OID	640892615
Product	hypothetical protein
Protein accession	YP_001430601
Protein GI	156740472
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTATGA CGAAACGCAC ATCTCGTCCA ATCATCTCCC GCCGTCGCTT CCTTCAGGCG 
TGTGCATGCA CGGTTGCAGC CGGGGCGCTT GGCGCAACGG GGTATGTCGT CGCCAACGCT 
CCGCTTCCCC CACCGTATCC TGAATCATCG GTCTTTCAGA CGCCGGTTGC AGGTATACCG 
ACGCCTGGCG CGCCTATCCT GTTGGTGACG AATCCAGGTG CGCAGCCGTC GTTTGGCGCG 
TACCTTGGCG CTATTCTGCG CGCGGAAGGG TTCGTAGCGT TTCGGATGGC ACGCCTCGAT 
GCGATCAATC CGGCGCTGCT GGCGCAGTTT CCGCTCGTGC TGCTGACAGT CGGTCCGTTG 
ACCGCAGAAG CGTCCGATCT GTTCCGGGCA TATGTGCTGA ATGGCGGGCA TCTGATTGCA 
TTTCGTCCCG ATCCGCGCCT CGCCGACCTC ATGGGTGTGC GCGCGCTCGG AGGTGATGTG 
ACCGACGGAA TGCTGGCGGT CGCCGATCAT CTGCTCGCGC AGGGCATTAC CACCCAGGCG 
CTTCAGGTTC ACACCCCGAT GGCGCAGTAT GAACTGGCGG GCGCTGAGGC GGTCGCCTGG 
ATCGCCCGTC GTGACAGCAG CCGAACGTCC TACCCTGCTG TGACGCTGAT GCGCGCCAAA 
AAAGGCATCG CTGCGCTGTG GGCATTCGAC CTGCCCCGTA ACATCGCCCT CATCCGCCAG 
GGGAATCCGG CAGCGGCAAA CCAGGAGCGC GACGGGATGG AAGGCGTTCG GACGGTTGAT 
CTGTTTGTGG ATTGGATCGA TCTTGATCGT ATTGACATTC CGCAGGCAGA CGAGCAGCAG 
CGATTGCTCG CAAATATGAT CCATGCGCTG GCGGGTGAGG CGCCGCTGCC GCGCCTCTGG 
CACCTGCCGG CTGGCGCTTC TGCGGTTCTG GTGGCAACCG GTGATGCGCA CGGACTGCTG 
GCTTCCCATA TTGCTACGGC GCTGGAACTG GTCAGCCGGT ACGATGGCGC GCTGTCGATC 
TACTATGCCC CGCCGCCGAT GAGCAACCGG TCGCGGACGC TGCGCCGGGT TCGTTGGTTG 
GCTGAAGAAT TGCCGGTTGC CGGCGCGGTC TTCACCGACG ACGCAGGGTA CCCCACTCCG 
AAAGATGTGG CGCGCTGGCG CGAAAGGGGA CACGGGTTCG GATTGCATCC CTACGTTGAA 
CAGGGAGTGG GCAAGGGGTA TCACGAGTAC TGGAATACCT TCATCAAACT GGGGTATGGA 
CCGGCTGAGC CAACCGTGCG CACCCATCGG GTGCTCTGGT CGGGGTGGGT CGAAACAGCG 
CGGGTGCAGG CGCAGTATGG ACTACGCATG AGTCTCGACC ACTACCACAG TGGTCCGCTG 
ATGCGTCGCG CAGACGGGCG CTGGGTTCAT GGGTACCTCA CGGGGAGCGG ACTGCCCATG 
CCGTTCGTCG ATGAGCAAGG GAATCTGTTG CGAGTCTATC AGCAGCATAC GCACATTGTC 
GATGAGCACC TGATGCGGGT GTTCGACACC GGCTACGAGA TGGGAGTGGA TGTCAATGAA 
GCCATTGCCA TCGCGTGCCG GCAGATCGAT GCAGCGGTAG AGCAATATCC CTCGGCGCTT 
GGATTACAGT GTCATATCGA CCCGTTTGCC TTTGGCGGCG AGAAGGCGGA GGCGGCGAGT 
GTGTGGTTCG ACCGCGTGCT CGACCATGCG GCGTCGCGCG GGGTGATGAT TGTGTCGGCG 
GAACAATGGC TGGCGTTCAC CGAGATGCGC GATCAGGCGG AGATGCGCAA CCTGATGTGG 
AATGAGTCTG AGGGCGTGTT GATGTTCGAA GCGGTTATTA GTGCGGAGTC GCAGCGCGCG 
CCGGCGCTTC TGCTGCCCCT GGAACACCGC AGGCGCATAC TGCGCCAGGT GACGATTGAT 
AGCGTGCTGG CGAGCGCCGA GCAAAAGCGT GTGGGGGGAG TCGCCTACGG TGCGGTGGCG 
CTGGCTGCCG GGAGGCGACA GGTGAGGGCA TATTATAGAT GA

Protein sequence

MTMTKRTSRP IISRRRFLQA CACTVAAGAL GATGYVVANA PLPPPYPESS VFQTPVAGIP 
TPGAPILLVT NPGAQPSFGA YLGAILRAEG FVAFRMARLD AINPALLAQF PLVLLTVGPL 
TAEASDLFRA YVLNGGHLIA FRPDPRLADL MGVRALGGDV TDGMLAVADH LLAQGITTQA 
LQVHTPMAQY ELAGAEAVAW IARRDSSRTS YPAVTLMRAK KGIAALWAFD LPRNIALIRQ 
GNPAAANQER DGMEGVRTVD LFVDWIDLDR IDIPQADEQQ RLLANMIHAL AGEAPLPRLW 
HLPAGASAVL VATGDAHGLL ASHIATALEL VSRYDGALSI YYAPPPMSNR SRTLRRVRWL 
AEELPVAGAV FTDDAGYPTP KDVARWRERG HGFGLHPYVE QGVGKGYHEY WNTFIKLGYG 
PAEPTVRTHR VLWSGWVETA RVQAQYGLRM SLDHYHSGPL MRRADGRWVH GYLTGSGLPM 
PFVDEQGNLL RVYQQHTHIV DEHLMRVFDT GYEMGVDVNE AIAIACRQID AAVEQYPSAL 
GLQCHIDPFA FGGEKAEAAS VWFDRVLDHA ASRGVMIVSA EQWLAFTEMR DQAEMRNLMW 
NESEGVLMFE AVISAESQRA PALLLPLEHR RRILRQVTID SVLASAEQKR VGGVAYGAVA 
LAAGRRQVRA YYR