Gene Tery_4999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_4999
Symbol
ID	4246654
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	+
Start bp	7640499
End bp	7641593
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	44%
IMG OID	638109810
Product	phosphonate metabolism
Protein accession	YP_724386
Protein GI	113478325
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3626] Uncharacterized enzyme of phosphonate metabolism
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00419491
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGATATG TTGCAATCAA AGGTGGAGAA ACCGCTATTT CTGAAGCGAT CGCTTTATTG 
GATTTCTTGC GGGCTAAGGA TAGTAATGAA CCTCCTTTAT CAATTGGAGG CATTCAGCAT 
CAGCTGCACG CACTCCATAG CCGAGTATTA TCAGAAGGGG GAATATACCA TCCCAAATTA 
GCAGCCCTAG CAATTAAACA AAATGCTGGA GATACTTTAG AAGCAGCTTT TTATCTGCGT 
GCTTACCGTT CCACCTGTCC TCGGATTGGT ATTACCCCCC TGCAGAAAAC CGAGCAGATG 
CGCTTAATTC GTCGTATTTC CGCTGCTTTC AAAGAAATAC CCGGCGGACA AATGCTAGGT 
CCTACCTCTG ATTATTTGCA ACGGTTATTT AGATTTGAAC TATTAGACGA ATCTCCCCAA 
CGCTTCCAGC AAATTGCCAA AACATGGTTG CACAACATAC CAGATGAGTG TCTTCCTACT 
AGTTTCCCCA AAGTCCTGGA TAGCTTGCGG GCACAGAATT TACTACCACC TGTAGAAACA 
AAACTCCATC AACCCTTTGA TATTACCAGG GAACCCCTAG TATTTCCAGT TCCCCGTTCT 
GCAGCCTTAG CTACCATGTC TCGTGCTGAA ACCGGTTCCC TATTAGGAAT TGCCTATTCT 
AATATGCGGG GTTATGGTGA TATTCACCCC ACTGTAGCAG AATTACGTGT GGGTTATTTA 
CCTGTACTAC TACCCCATCC TATTTCTGGA GAATTGATGG AAGCGGGTGA TGTGTTAATG 
ACAGAGTGCG AAATTGTCGC CATGTACGAA GCACCAACTA AGGATAGCAA ACCTACCTTT 
GGCTTAGGCT ATGGTGCTTG TTTTGGGCAC AACGAAGTCA AGGCAATTTC TATGGCAATT 
CTTGATCGTG CTTTGCAAAA AGGGCAGCAA CAGGGAGTAG AAAATCCTTC AGAAGACCCA 
GAATTTGTCC TCCTCCATGT TGATGGGATT GAATCAATGG GATTTGCTTC CCATTACAAA 
ATGCCCCACT ATGTAACTTT TCAGTCTGAT TTAGATCGGT TGAGAACGAC CCAAAAAAAA 
GGAGAAAGCC TATGA

Protein sequence

MGYVAIKGGE TAISEAIALL DFLRAKDSNE PPLSIGGIQH QLHALHSRVL SEGGIYHPKL 
AALAIKQNAG DTLEAAFYLR AYRSTCPRIG ITPLQKTEQM RLIRRISAAF KEIPGGQMLG 
PTSDYLQRLF RFELLDESPQ RFQQIAKTWL HNIPDECLPT SFPKVLDSLR AQNLLPPVET 
KLHQPFDITR EPLVFPVPRS AALATMSRAE TGSLLGIAYS NMRGYGDIHP TVAELRVGYL 
PVLLPHPISG ELMEAGDVLM TECEIVAMYE APTKDSKPTF GLGYGACFGH NEVKAISMAI 
LDRALQKGQQ QGVENPSEDP EFVLLHVDGI ESMGFASHYK MPHYVTFQSD LDRLRTTQKK 
GESL