Gene NATL1_01621 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_01621
Symbol	xseA
ID	4779985
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	156443
End bp	157603
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	31%
IMG OID	640083426
Product	exonuclease VII, large subunit
Protein accession	YP_001013991
Protein GI	124024875
COG category	[L] Replication, recombination and repair
COG ID	[COG1570] Exonuclease VII, large subunit
TIGRFAM ID	[TIGR00237] exodeoxyribonuclease VII, large subunit

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.381719
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACTGATC TTAAAAACGC TAAACAATCT CTAAATACAT ATAGTGTTAA AGAATTAAAC 
GAATCTATTG GCTTATTATT ATCAAGAGGC TTTGCCCCAA AGTTTATAGT TGAAGCCACT 
GTTTCTAAAT CGCAAATAAA AAAAGGTCAT TTATGGCTAA CTTTAACGGA CGGGAAAGCA 
AGTGTAGATG CGGTTGCATG GTCATCAACA ATAAAGTCTT TAAAATTTTT ACCAAAGCAA 
GATGATGGCG TTGTTATTAT TGGTAAATTA AATTTCTGGG AATCTCAAGC AAGAGTATCG 
GTACAAGTTT TTGATATTCG ACCAAGTATT TCTACGGTTC TTAGGAAGTT CGAAATAGTC 
AAATCAAAAC TTTTTAAAGA AGGTTTGATT GATGATTCGT TAAGAAAAAA ATTGCCAAAA 
TATCCTCATT CAATTGGTAT CCTTACAAGT GTTCCAAGCT CTGCTTTAGC TGACATGCTT 
AGAACAGCTA AGGAGAGATG GCCATTAACG AAGCTGCAAA TAATTCCTAT TCCAGTTCAA 
GGTGATAATG CAAATAAACT AAAATCTATT TTAAGTAAAT TAAAAAAAAA TAAGTTAAAA 
TTAGAGGCTT TAATTATAGC TAGAGGAGGA GGTAGCAGAG AAGATTTAAT GTTGTTTGAT 
AGTGAAATCA TAGCTAGAGA AATCGCAACT TTCCCAATAC CTGTAATTAC AGGGATAGGT 
CACGAAGATG ATCTAACAGT TGCTGATCTG GTTTCAGATC ATCGATCTGC CACTCCAACT 
GCTGCGATTG TTGATCTATT GCCCTCAAGA GAAATTGAAA AAAATAAGTT TTTACAAAAT 
AAAAAATTAC TTAAATATTA TTTGAAATTG TTTTTTCAGA ACGCAAAGAA ATCATTAATT 
ACAAAAAAAT CTATTTTTCA ATCTTATTCA CCCCGACTAT TAATAAAAAA TAAAAGAACA 
AGAATAAATT ATATGTATGA TATTTTGAAT GCACTTTCTC CAAGAAAATT GTTAAAAAGA 
GGTTTTGCGC TAATTACTGA CGAGTCAGGT AATTCGATTT ATAGTGTAAA AAATATTAAG 
GAAAATGATA AGCTGATAGT TCAATTTTGT GATGGAAAAA TTACAGCAGA GGTTGATAGT 
CTTAATTATG ATAAAATATA A

Protein sequence

MTDLKNAKQS LNTYSVKELN ESIGLLLSRG FAPKFIVEAT VSKSQIKKGH LWLTLTDGKA 
SVDAVAWSST IKSLKFLPKQ DDGVVIIGKL NFWESQARVS VQVFDIRPSI STVLRKFEIV 
KSKLFKEGLI DDSLRKKLPK YPHSIGILTS VPSSALADML RTAKERWPLT KLQIIPIPVQ 
GDNANKLKSI LSKLKKNKLK LEALIIARGG GSREDLMLFD SEIIAREIAT FPIPVITGIG 
HEDDLTVADL VSDHRSATPT AAIVDLLPSR EIEKNKFLQN KKLLKYYLKL FFQNAKKSLI 
TKKSIFQSYS PRLLIKNKRT RINYMYDILN ALSPRKLLKR GFALITDESG NSIYSVKNIK 
ENDKLIVQFC DGKITAEVDS LNYDKI