Gene Rcas_3422 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_3422
Symbol
ID	5540921
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	4460780
End bp	4462168
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	62%
IMG OID	640895540
Product	FHA domain-containing protein
Protein accession	YP_001433490
Protein GI	156743361
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.22857
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGATCC GCTGTCCGCA GTGTCAGGCT GAAATTGCCG AGGGAAAACG CTTTTGTCCT 
CAGTGTGGCG CGCGCCTTCC TGAGCCGCCG GCGCCGGTGG GTGAGGCGGG GCGCACCGTG 
GTACTGCCTC CCGCAGGCGA TGCCGGAAAG ACGATGGTGG CGCCGCCGGC GCCAGCGGAA 
GATATGGGAC GTACCGTGTT GCTGTCGCCT GAGGAGGCTG CCGGGAAACC AGCCTCTCCT 
CCTTCAGCGC CGACCGGAGA TGCCGGAAAG ACGATAATGG TTCCGCCGGC GTCGTCGAGC 
GACACGGGGC GCACAGTGTT GCTGCCGCCG GAAGGCGACG CGGGGAAGTC GATGGCGGGT 
CCGCCGATGC CTCCTTCTGA AACGCCGTTG AGCAGCGCCG GGTTGCAGAC GATACTGGCC 
GATCAATCCC AGAAGCCGCA GCCGCCTGCT GCGGGTGCTT TCCCGGCATC GACTCAACCG 
CCGTCGGGTG GTGGGTTTGG CTTGCCGCCT TCCCCGCCAT CCGCGCCGCC GACATCATCT 
GCATTGGGGG GAGGCATTGG ATTGCCGCCA TCCACCCCGC CAACGGCAGG CAGCGGATTC 
GGGTTGCCCT CCTCTCCGCC CGCAGCCGGG AGTCCCGTCG CTCCGCCGCT GGCAACCACA 
CCCGCGAAAA AGGGACCCAA CTGGCTGCTG ATCATTGGCA TTATTCTCGG TGTCCTGGTG 
CTGGGGTGTC TCCTGGTACT CGGCGGTCTG TATGTGCTCG GTCGGCAGGC GGCTCAGTCG 
CTCGGCACCG CCATTTCCGG CACCGTTGTG AGTATTGACA ATCCGCCAGG GACGACCGAT 
TTTCCAAATG TGCTGCTGCG CGACTCGCTT GCGAGTGAGG CAGGCAGCCA GTTTACCGCC 
GAACGAACGG ATGCCGGCGA CTACCGCTTC GAAAATGGCG CCTATGTGAT CGAAGCGTTC 
GATGCGGATC AGATCGTCTG GCAGGTCATC GACAGCGTGG TCGATGATGC GTCGTTTGAG 
ATCGAGGCGA CGATCAGCAA ACCGCGCAGC GCGGCGATTG CGCTCCTTTT TCGGTATCAG 
GACAATCAGA ACTTCTACAT CCTGAGCGTT GATGGCAGAG GGCGCTACCG TGTCGCGCGC 
TATGTGAACG ATAATTTCTC AATTCTGCGC GATTGGGAGA CGTCGCCGGC AATCCAACCC 
GCCGGTTCGC CCAACCGGGT GAAGATCGAA ATGGTTGGCG ACTCGTTGAC ATTCTTCTGC 
AACGGTCAGC GTCTTGCCAA TCTGCGTGAT AGCGCCTTCC GCAGCGGCAA CCTCGCATTT 
GGTACAGAAA CCTTCGATGA GGGAGCGGGA GTCGTGCGTT TTACCAATCT GTTGGTGCGT 
GGTCGATAG

Protein sequence

MMIRCPQCQA EIAEGKRFCP QCGARLPEPP APVGEAGRTV VLPPAGDAGK TMVAPPAPAE 
DMGRTVLLSP EEAAGKPASP PSAPTGDAGK TIMVPPASSS DTGRTVLLPP EGDAGKSMAG 
PPMPPSETPL SSAGLQTILA DQSQKPQPPA AGAFPASTQP PSGGGFGLPP SPPSAPPTSS 
ALGGGIGLPP STPPTAGSGF GLPSSPPAAG SPVAPPLATT PAKKGPNWLL IIGIILGVLV 
LGCLLVLGGL YVLGRQAAQS LGTAISGTVV SIDNPPGTTD FPNVLLRDSL ASEAGSQFTA 
ERTDAGDYRF ENGAYVIEAF DADQIVWQVI DSVVDDASFE IEATISKPRS AAIALLFRYQ 
DNQNFYILSV DGRGRYRVAR YVNDNFSILR DWETSPAIQP AGSPNRVKIE MVGDSLTFFC 
NGQRLANLRD SAFRSGNLAF GTETFDEGAG VVRFTNLLVR GR