Gene Rcas_1621 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1621
Symbol
ID	5539097
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	2094693
End bp	2096213
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	65%
IMG OID	640893758
Product	MazG family protein
Protein accession	YP_001431731
Protein GI	156741602
COG category	[R] General function prediction only
COG ID	[COG3956] Protein containing tetrapyrrole methyltransferase domain and MazG-like (predicted pyrophosphatase) domain
TIGRFAM ID	[TIGR00444] MazG family protein

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.909827
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCACGC TTGTGGGGCT TGGTCCCGGC GATCCGGGCT TGATCACGCG CGCGGCGTGG 
GAGATGATTT CCGCAGCGCG CGTGCTCTAT CTGCGCACCG CTGTGCATCC GACGGTCGCT 
GCGTTGCCGC CGTCGGTCGT CGTGCGCGCC TTTGACGATC TGTACGAACA GGCAGAGCGT 
TTCGACGAGG TGTATGAGCG GATCGCCGAT GAACTGATCG CGCGCGCGCG CGGCGGTGAG 
GCCGTGGTGT ATGCGACGCC GGGCGACCCG CTGACGGCGG AAGCCACATC GCGCCATCTG 
CTGCGCCGCG CGCGCGCGCA GGGCGTTCCG GCGCGGGTTG TCCCCGGCGT CAGTTTTGTC 
GAACCGGTCT GTGCGCTGTT GGGTGTCGAT CCACTCGAAC ATGGGTTGCA ATTGCTCGAT 
GCGCTCGATC TGATGGTCGG CGACACAACG GTCGATGCGC CTTCGTGGGC GTCGCTCCAC 
GGCTTTACGT ACACGCCGCC GCTCCTGCCG TTTCCGCTGA CGCCGACGCG CCCGGCGCTG 
ATCTGTCAGG TCTACAGCCG GTCGGTCGCG TCACACGTCA AACTGTCGCT CCTGGAACGC 
TACCCGGTTG ACCATCTGGT GACGCTGGTG CGCGCCGCCG GGGTCGTCGA TGCGGAGGCG 
GCGGTTGAAT TGCCGCTCCA CACGCTCGAC CATCGCAATG ATTTCGATCA CCTGACGAGT 
CTGTTTGTGC CGCCACTGAC GCCCCTTGCC GACCTGCGCG GACCGGACGG TGTGGCATAT 
GTCGTCGCGC GGTTGCTTGG TCCGGGCGGG TGCCCGTGGG ATCGTGAGCA GACTCCGCAA 
TCGTTGCGGG CATCGTTGCT CGAAGAGGTG CATGAGGCAT TGGAGGCGCT CGATGCCGGC 
AACGACGAGG CGCTGGTCGA AGAACTGGGC GATGTGCTGA TCAATGTGCT GATGCTGAGC 
GAAATGGCGC GTCAGGCAGA GCGCTTCGAC GCTGGCGAGG TGTTCAATGC CGTGGCTGGC 
AAGTTGATCC GCCGCCATCC CCACGTCTTC GGCGAGCTGG ATGTCGCAGC GAGCGATCAG 
GTCTTGCACA ACTGGGAAGC GATCAAGCGC GCCGAGCATG CCACAAAAGG GGTGTCACGC 
CAGAGTGCGC TCGATGGCAT TCCGCCATCA TTGCCCGCGC TGGCAGCCGC GCAGAAGGTG 
GTGTCGAAGG CCGCCAGAGC CGGGTTCGAT GCGCCGGAGA TTGACCACGC CTGGGATGCC 
CTGGCGGAAG AACTTGCCGA ACTACGCGCC GTCACAACCG ATCCTGCGCA GGCGGAAGCA 
GAATTGGGCG ATCTGCTCCT GGCGGTTGCC CGTCTGGGGT GGCGGCTCGA TGTGGATGCG 
GAAAGTGCGT TGCGCGCAGC GGTTGCGCGT TTTCGGCGCC GCTTCGCGCG CCTTGAAACG 
TTGCTCAACG GGCGCGATCT TCGCTCTCTG AGCATCGACG AAAAACTGGC ACTGTGGGAA 
CGCGCGCGTG ACGATGGCTG A

Protein sequence

MITLVGLGPG DPGLITRAAW EMISAARVLY LRTAVHPTVA ALPPSVVVRA FDDLYEQAER 
FDEVYERIAD ELIARARGGE AVVYATPGDP LTAEATSRHL LRRARAQGVP ARVVPGVSFV 
EPVCALLGVD PLEHGLQLLD ALDLMVGDTT VDAPSWASLH GFTYTPPLLP FPLTPTRPAL 
ICQVYSRSVA SHVKLSLLER YPVDHLVTLV RAAGVVDAEA AVELPLHTLD HRNDFDHLTS 
LFVPPLTPLA DLRGPDGVAY VVARLLGPGG CPWDREQTPQ SLRASLLEEV HEALEALDAG 
NDEALVEELG DVLINVLMLS EMARQAERFD AGEVFNAVAG KLIRRHPHVF GELDVAASDQ 
VLHNWEAIKR AEHATKGVSR QSALDGIPPS LPALAAAQKV VSKAARAGFD APEIDHAWDA 
LAEELAELRA VTTDPAQAEA ELGDLLLAVA RLGWRLDVDA ESALRAAVAR FRRRFARLET 
LLNGRDLRSL SIDEKLALWE RARDDG