Gene PHATRDRAFT_40880 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_40880
Symbol
ID	7198791
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011694
Strand	-
Start bp	175436
End bp	176999
Gene Length	1564 bp
Protein Length	416 aa
Translation table
GC content	54%
IMG OID
Product	agmatinase
Protein accession	XP_002184908
Protein GI	219129463
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCAGTG CCACGGTTGC CAACGCTCGT CTCGCCTTTC AATCGGTCGC TCGGAAAGCC 
GCCCGCTTTA CTCCGACCGT GGGGGCCTCG CAAACCCAGA TCCGTTTCCA CCATCCTGAT 
CCCTTCAACC CCAAGGTCAC CAAAGGATGG AAGGCCGCTG TCAAGGTGCG TGTATGTATG 
CAAGCATGAA TGCCTGCATA CTATCCTTGT CAACGATACG TGTTGCTCGT AGCCGAGCTT 
GTTTTTTTGG TCGACGTAGC CGCATACTGC TTCGCTACTA GTTACGATAC TCTGCAGTCT 
CCCGGTGCCC TCTGTTCACA GTCAATCTCC GTCCTGTCCT CTCACGTCTA CCACTTTGAC 
TATTCTTCAA CAGGAAGCTG AGTTGCCGAC AACGCGGGCG GATCAAGAAA TTGCCAACGC 
CCTCCACTTG GGTTTACAGG GTGCCAGCAG TATCGAGGAC AAGTCGATAC CGACGTTTTC 
CCGTGGTGAA CTACCACACT TTGCCGGTAT CAATACCTTC CTCAAGGCTC CGTACGTCGA 
AGATGTCCGG GACGTTGGCA AGTACGACGC CACCGTCTTT GGCGTGCCCT TTGACGGGGG 
TTGTACCTAC CGTTCCGGTA CCCGTTTTGG CCCTCAAGGA ATCCGACGCA TCTCGGCATT 
GTACACTCCG TACAATTACG AACGCGGCAT TGATCTTCGG GAACAAATGA CCTTGTGCGA 
TGCGGGAGAT GTGTAAGTGA CGCTGCTTGA TCGCAGAGCG TAAGACAGAC TGACAACTTG 
ACTCGGTGCA CGGTCGGTCT GACTGTTGAT CAACTCGTCA ATTTTTCTTC TTTTCAGATT 
TACCATTCCC GCCAACTTGG AAAAGTCATT TGACCAGATT AGCAACGCTG TGGCTCACAT 
TGCGAGTACC GGTACTATGC CCATTATTCT TGGTGGGGAT CATTCTATCG GTTTCCCCAC 
CGTCCGTGGG TTGGCCTCGG TGACGACCAA AAACATTGGT ATCATTCACG TGGATCGTCA 
CGCGGACATT CAGGAAAAGG ATTTGGACGA ACGCATGCAC ACGACACCGT ACTTCCACGC 
GACCAATTTG CCCAACGTCA ACGCCAAGAA CCTCGTCCAA ATCGGTATCG GTGGATGGCA 
GGTTCCCCGC CCGGCTGTGG CCAACATGGT CGAACGCGAA ACTAACATTT TTACCATGGA 
CGACATTGAA GAATACGGTA TCGAAAAGAT TGCCGAAATG GCTTTGGAAC GTGCCTGGGA 
CGGCTGCGAT GCGGTCTACA TGAGTTACGA CATTGACAGC ATCGAAGCCG CATTTGTGCC 
CGGCACGGGT TGGCCCGAAC CGGGCGGTCT CTTGCCTCGT GAAGCCCTCA AACTAGTGGG 
ACTCGTGGCC GCCGAAGGTC TCTGCGGCAT GGAAGTCGTC GAAGTCAGCC CGCCCTACGA 
TCACGCCGAC ATTACGTCCC TCATGGCCTT GCGCATCGTC GTAGACGCCC TCGGCTCCAT 
GGTTTCACAC GGAACCATGG GCAAACATAA GCACATTATC GACAAGGAAT TCGTTCCCTT 
TTGA

Protein sequence

MSSATVANAR LAFQSVARKA ARFTPTVGAS QTQIRFHHPD PFNPKVTKGW KAAVKEAELP 
TTRADQEIAN ALHLGLQGAS SIEDKSIPTF SRGELPHFAG INTFLKAPYV EDVRDVGKYD 
ATVFGVPFDG GCTYRSGTRF GPQGIRRISA LYTPYNYERG IDLREQMTLC DAGDVFTIPA 
NLEKSFDQIS NAVAHIASTG TMPIILGGDH SIGFPTVRGL ASVTTKNIGI IHVDRHADIQ 
EKDLDERMHT TPYFHATNLP NVNAKNLVQI GIGGWQVPRP AVANMVERET NIFTMDDIEE 
YGIEKIAEMA LERAWDGCDA VYMSYDIDSI EAAFVPGTGW PEPGGLLPRE ALKLVGLVAA 
EGLCGMEVVE VSPPYDHADI TSLMALRIVV DALGSMVSHG TMGKHKHIID KEFVPF