Gene Nmul_A1030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1030
Symbol	xseA
ID	3785157
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	1191375
End bp	1192718
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	57%
IMG OID	637811114
Product	exodeoxyribonuclease VII large subunit
Protein accession	YP_411725
Protein GI	82702159
COG category	[L] Replication, recombination and repair
COG ID	[COG1570] Exonuclease VII, large subunit
TIGRFAM ID	[TIGR00237] exodeoxyribonuclease VII, large subunit

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000189378
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCACG TTCTGGAAAT GGGTTTCGAG CGGGCGGTCA TGAGCGTAAG CGAATTGAAC 
CGCAATGCCA AGGAGTTGCT GGAGCAGGCT TTTCCATTAT CCTGGGTGGC TGGCGAGATC 
TCCAATATCA AGTGCTATGG CTCCGGCCAC TGGTATTTTT CCCTGAAGGA TGAGATTGCT 
CAGGTGCGCT GTGTCATGTT CCGGGAAAAA AACCAGTATC TTGATTGGCA GCCTCGGGAT 
GGCATGCGGG TGGAAGTGCG CGCCCTGGTA ACGCTATATC ATGCGCGCGG CGATTTCCAA 
CTGAACATCG AGACTATCCG CCACGCCGGA CTCGGTTCGC TGTTTGAAGC TTTCGAGCAA 
CTCAAGGCGA GGCTTGGAAA AGAGGGGTTG TTCGATTCTG AGCGCAAGAA ACCATTGCCA 
GAGTTTCCAA AGCAGATCGG GATCATCACT TCTCCTGCCG CCGCGGCGCT GCATGATGTG 
CTGTCCACCT TGCAGCGGCG TATGCCTTCC GTGCCCATAA TCGTTTATCC AACGATTGTT 
CAGGGCGCTG GCGCTTCAGT AAGGATCGCG GGCGCCATTC AAACCGCTGC AAGCCGGGCT 
GAGTGCGATG TACTGATACT GTGCCGCGGG GGTGGCTCTC TGGAAGATCT GTGGGCTTTC 
AACGAGGAGG TTGTGGCACG CGCAATCGCG GCTTGTTCCA TTCCCATTGT CAGTGGAGTG 
GGTCACGAAA CCGATTTTAC CATTGCGGAT TTTGTTGCGG ATGTCCGCGC GCCCACGCCG 
ACTGGCGCAT CCCAGCTCGT GTGCCCGGAT CGCGCAGAAG TGGCGAGATG CGGAGAAATT 
CTTCGTGGAC GCATGTACCG CGCGATGCAA CGGCGCATCG AAAGCCGGAT GCAGCATACG 
GATATGCTGG GGTGCCGTCT GGTACATCCG GGAAAGCGCA TCGAAGCACA ACTGGCGCAG 
CTTGCGCGTT TGCGCGAACG CCTGGAAAGC GCATGGCTAC GTCACGCGAA AGAGAGGCAC 
TGGCGCTTGC GCGAGCTCCA GCAGCGCATG AAGATTGCCC GGCCCGACAT CCCACGGCTG 
GAAGGGCGCC AGCAGCAACT CGGTCTACGC CTTCAGCGGG CGATCGCATC CCGGATTGAA 
ACTCTCGGCA TGCACTTGCA GCGCAGGGAA GCAAATCTTT CCCATCTGAA TCCGGATTCC 
GTTCTGGCGC GAGGCTACAG TATTGCTTAT ACCTCCGATG GCACGGTATT GAGAAGAAAT 
GATCAGGTCG ATGTTGGCGA TGTCATCCGC GTGACGTTTG CGAAAGGATG GAGCAAGGCG 
TCCGTGATGG AGAAGGGCGA GTAG

Protein sequence

MNHVLEMGFE RAVMSVSELN RNAKELLEQA FPLSWVAGEI SNIKCYGSGH WYFSLKDEIA 
QVRCVMFREK NQYLDWQPRD GMRVEVRALV TLYHARGDFQ LNIETIRHAG LGSLFEAFEQ 
LKARLGKEGL FDSERKKPLP EFPKQIGIIT SPAAAALHDV LSTLQRRMPS VPIIVYPTIV 
QGAGASVRIA GAIQTAASRA ECDVLILCRG GGSLEDLWAF NEEVVARAIA ACSIPIVSGV 
GHETDFTIAD FVADVRAPTP TGASQLVCPD RAEVARCGEI LRGRMYRAMQ RRIESRMQHT 
DMLGCRLVHP GKRIEAQLAQ LARLRERLES AWLRHAKERH WRLRELQQRM KIARPDIPRL 
EGRQQQLGLR LQRAIASRIE TLGMHLQRRE ANLSHLNPDS VLARGYSIAY TSDGTVLRRN 
DQVDVGDVIR VTFAKGWSKA SVMEKGE