Gene GM21_1528 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_1528
Symbol
ID	8136857
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	1791370
End bp	1792449
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	65%
IMG OID	644869140
Product	DNA protecting protein DprA
Protein accession	YP_003021342
Protein GI	253700153
COG category	[L] Replication, recombination and repair [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0758] Predicted Rossmann fold nucleotide-binding protein involved in DNA uptake
TIGRFAM ID	[TIGR00732] DNA protecting protein DprA

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	1.42126e-31
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGATCACT ACTACTGGTT CGCGCTCAAG TCGGCGCCGC TGGTGGGAAA CGTTACCTTC 
CTGCGGCTTT TGTCCCGCTT CGGGACGCCG GAGCGCGCGC TCAAGGCCTC CCTGCAAGAG 
CTCTCGGAAG TGAAGGGAGT GAGCCCGCAG GCCGCGGCCT CCATAGCCGG TCACGACTAC 
GCTCACCAGG CGTCGAGCGA ATGCGAGAAG GTGCGGGCCT GCGGCGTCGA CGTCATCGAC 
ATCCTGTCGC ATCGCTACCC TCGCCTTTTG ATGGAGATCC CGGACCCTCC CCCCTATTTT 
TATCTCAAGG GGGCGCTTTC CGGCAGCGAA ACCGCGGTCG CCATGGTCGG TTCCAGGCGG 
GCTTCGCAGT ACGGCCTCTG CACCGCGACG AGGCTTGCGC GCGACCTGGC GCTGCAGGGA 
ATCACCGTCG TCTCCGGGAT GGCGCGCGGC ATAGACACGG CGGCGCACTG GGGGGCGCTC 
AAGGCGGGCG GCCGTAGCGT CGCCGTACTC GGTTGCGGAA TAGACCTCGT CTACCCGCCG 
GAGAACGGTG CTCTCTACCA GGCTCTCGCC GATAACGGGG CGCTCATCAG CGAATTCCCC 
ATGGGGACCG CGCCTTTGGC TGAGAACTTC CCCCGCCGCA ACAGGATCAT CAGCGCGCTG 
TCGCGCGGCG TGCTGGTAGT CGAGGCGGGG GAGGCGAGCG GTTCGCTGAT CACGGCGCAT 
TACGCGCTGG AGCAGGGGCG CGAGGTCTTC GCCGTCCCCG GCAACGTCTC GGTGAGCGGC 
AGCAGGGGCG CTAACGGCTT GATCAAGGAA GGGGCGAAGC TGGTGGAGCG CGTGGAGGAT 
ATCCTGGAGG AGCTAGGCCT GGAGCCGCAG GCGAACCTTC CCCTCCCGAA GCCCTCAAGC 
TTCGAGCTCA CCCCGCAGGA GGCGGAGCTT TACGCCCTTC TTTGCCAGGG GGCGCTGCAG 
ATCGACGACA TCATCGTGCA GAGCGCGTTG ACAGCAAGCG AGGTTTCCGC TACTTTACTT 
CGCTTGGAAA TGAAGGGAGC CATAGTCCAA CTCCCGGGCA AGCGCTTCGC AGTTGCGTGA

Protein sequence

MDHYYWFALK SAPLVGNVTF LRLLSRFGTP ERALKASLQE LSEVKGVSPQ AAASIAGHDY 
AHQASSECEK VRACGVDVID ILSHRYPRLL MEIPDPPPYF YLKGALSGSE TAVAMVGSRR 
ASQYGLCTAT RLARDLALQG ITVVSGMARG IDTAAHWGAL KAGGRSVAVL GCGIDLVYPP 
ENGALYQALA DNGALISEFP MGTAPLAENF PRRNRIISAL SRGVLVVEAG EASGSLITAH 
YALEQGREVF AVPGNVSVSG SRGANGLIKE GAKLVERVED ILEELGLEPQ ANLPLPKPSS 
FELTPQEAEL YALLCQGALQ IDDIIVQSAL TASEVSATLL RLEMKGAIVQ LPGKRFAVA