Gene Rpal_4037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4037
Symbol
ID	6411720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	4329098
End bp	4330786
Gene Length	1689 bp
Protein Length	562 aa
Translation table	11
GC content	71%
IMG OID	642713919
Product	DNA repair protein RecN
Protein accession	YP_001993008
Protein GI	192292403
COG category	[L] Replication, recombination and repair
COG ID	[COG0497] ATPase involved in DNA repair
TIGRFAM ID	[TIGR00634] DNA repair protein RecN

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.531713
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTGCCC GCCTGTCGAT CCGCGATATC GTGTTGATCG AGCGGCTCGA CATCGAGTTT 
TCCCGTGGCC TTGCGGTGCT GACCGGCGAG ACCGGCGCCG GCAAATCGAT TCTGCTCGAT 
GCCTTCGCGC TGGCGCTCGG CGGCCGCGGC GATGCCGCGC TGGTCCGCCA CGGCGCCGCC 
GAGCACGGCC AGGTCACCGC CAGCTTTGAT GTCGCTAAGA CCCATCCAGC GTTCGCGATT 
CTCAAGGCCA ATGGTCTCGA CGACCGTGAG GTCGACGAAT CCGGCGAATT GATCCTGCGC 
CGCGTCCAGC TCGCCGACGG CCGCACCCGC GCCTTCATCA ACGACCAGTC GGTCAGCGTG 
CAGACCCTCA AGGCGGTCGG CGCGACGCTG GTCGAGATCC ACGGCCAGCA CGACGAGCGC 
GCGCTGGTCG ACGCCGCCAC CCATCGCCGG CTGCTCGACG CCTTCGCAGG CCTTGAGAAG 
GACGTCGTTT CTCTTGAGGC GCTGTGGGAG GGCCGCCGCA CCGCGCGGGC CGCACTCGAC 
GCCCATCGCG CCGGCATGGA GCGCGCGGCG CGCGAGGCCG ACTACCTGCG CCATGCCGCC 
GACGAACTGA AGCAGCTCGC GCCGCAGGAC GGCGAGGAGA CCTCGCTGGC CGAGCGTCGC 
ACCACCATGA TGCAGGGCGA GAAGATCGCC GCCGACCTGC GCGAGGCGCA GGAGGTTGTC 
GGCGGGCATC ATTCGCCGGT CGCCGCGCTG GCCTCCGCGG TGCGCCGGCT GGAGCGCCGC 
GCCGGCACCG CGCCGCAGCT GATCGAGCCC GCCGTGCGCG CGATCGACGC CGCCATCAAC 
GCGTTGGAAG AAGCCGACCA GCATCTCAAC GCCGCGCTCG CCGCAGCCGA TTTCGACCCG 
TTGGAACTGG AGCGGATCGA GGAGCGGTTG TTCGCGCTGC GCGCCGCCGC CCGCAAGTAT 
TCGACCCCGG TGGATTCGCT CGCCGCGCTC GCCGCGCAAT ACGTCGCCGA TGTCGCGCTG 
ATCGATGCCG GCGCCGACCG GCTGGTGGCG CTGGAGAAGG CCGCGGCCGA AGCCGACGCC 
CGCTACGGCG CCGCCGCGGC GAAGCTGTCG GCCGCGCGCG CCAAGGCCGC CGACAAGCTC 
AACAAGGCGG TCGGCGCAGA GCTGGCGCCG CTCAAGCTCG AACGCGCCAA GTTCATGACC 
CAGGTCGAGG CCGACGAGGC CGCGCCGGGC CCGCAGGGCA TCGACCGCGT CGAATTCTGG 
GTGCAGACCA ATCCCGGCAC GCGCCCCGGC CCGTTGATGA AGGTGGCGTC GGGCGGCGAG 
CTGTCGCGCT TCCTGCTGGC GCTGAAAGTG GTGCTGTCCG ACAAGGGCTC GGCGCCGACT 
TTGGTGTTCG ACGAGATCGA CACCGGCGTC GGCGGCGCGG TCGCGGACGC GATCGGCGCC 
CGGCTGGCGC GGCTGGCCTC GAAGGTCCAG GTGATGGCCG TGACCCACGC TCCCCAGGTC 
GCGGCGCGTG CCGATCAGCA TCTGCTGATC TCCAAGGCCG CCCTCGACAA GGGCAAACGC 
GTCGCCACCC GCGTCGCCGC CCTGGAACAG GACCACCGCC GCGAAGAAAT CGCCCGCATG 
CTGGCTGGTG CCGAGATCAC CGCCGAGGCG AGGGCTGCGG CGGACCGGCT GATCAAGGCG 
GCGGGGTAG

Protein sequence

MLARLSIRDI VLIERLDIEF SRGLAVLTGE TGAGKSILLD AFALALGGRG DAALVRHGAA 
EHGQVTASFD VAKTHPAFAI LKANGLDDRE VDESGELILR RVQLADGRTR AFINDQSVSV 
QTLKAVGATL VEIHGQHDER ALVDAATHRR LLDAFAGLEK DVVSLEALWE GRRTARAALD 
AHRAGMERAA READYLRHAA DELKQLAPQD GEETSLAERR TTMMQGEKIA ADLREAQEVV 
GGHHSPVAAL ASAVRRLERR AGTAPQLIEP AVRAIDAAIN ALEEADQHLN AALAAADFDP 
LELERIEERL FALRAAARKY STPVDSLAAL AAQYVADVAL IDAGADRLVA LEKAAAEADA 
RYGAAAAKLS AARAKAADKL NKAVGAELAP LKLERAKFMT QVEADEAAPG PQGIDRVEFW 
VQTNPGTRPG PLMKVASGGE LSRFLLALKV VLSDKGSAPT LVFDEIDTGV GGAVADAIGA 
RLARLASKVQ VMAVTHAPQV AARADQHLLI SKAALDKGKR VATRVAALEQ DHRREEIARM 
LAGAEITAEA RAAADRLIKA AG