Gene Tery_3693 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_3693
Symbol
ID	4243868
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	5670688
End bp	5672076
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	38%
IMG OID	638108640
Product	cytochrome P450
Protein accession	YP_723227
Protein GI	113477166
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.429017
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.314695
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCTAC CTGATGGCCC AAGTCTGTCA CCATTACAAC GAAGACTCCG GACATGGAAA 
TTTATTTTTA GTCCCTTATC TGCCATAGAA GAGCGATACT CTGAATATGG AGATATCTTT 
AGAACGAATA CTAACTCCTT GTATCCTTTC ATCTACTTCT GCAATCCTAA AGCCATTCAA 
CAAATTTTTA CCGCGGATCC TGATACTTTT ACCTCAGGAA GTATAAATGG TATTTTAAAA 
TATTTTGTGG GCCTAAATTC TCTATTGCTC CAAGATGGCG ATCGCCACAA ACGACAAAGA 
AAACTATTAA TGCCACCTTT TCATGGTGAT CGGATGCGTA AATATGGAGA CCTAATCTAT 
AACATCACTT CTAATGTTAT TAGTCAGTGG AAAATAGAAC AACCTTTTCC TATTCGCAAG 
TCAACTCAAG AAATATCTCT CAAAGTAATT CTTGCTGCTG TATTTGGTTT AGATCAAGAA 
GGAAAAAGTT ATGAAAAACT TAGAGTTCTT ATGTCTGATC TTCTAGACTC TATGAGTTCT 
CCCCTCAGCT CTACTTTTCT GTTCTTCAAT TTTTTACGAA AAGACTGGGG TCCTTGGAGT 
CCATGGGGGA GATTTTTGCG CAAAAAGCAA GAACTCCATG AACTAATAAT TGCAGAAATT 
CAAACTGCAA AGAAAGAAGG AAATCATCGT GATGATATTC TTAGTTTATT ACTAGAAGCC 
CGTGATGAAG CAGGTAATGC TATGAGCGAC GAAGAAATTA AGGATGAACT ACTGACAATG 
CTTTTCGCTG GTCACGAAAC TACGGCATCA GCTTTAGCAT GGGCATTATA TTGGATTGAT 
ATGATCCCAT CAGTGGGTGA AAAACTCATG GCAGAATTAG CAACTATTCC TAGTAACTCG 
GATCAAGTTG CTATTACTAA ACTTCCTTAC CTCAGCGCTA TTTGTCAAGA AACTCTTCGC 
ATTTATCCTA TTGCTATGAA TGCTTTCCCT AGAGTTGTTC AGAAACCTAT AGAAATTATG 
GGTTATCAAC TTGAACCGGG AATGGTGGCG ATAGTGCCTA TTTATCTGAC TCATCATCGG 
GAGGATATTT ATCCAGAACC TAAAAAGTTT AAACCAGAAC GTTTTCTGGA AAGACAATTT 
TCACCTTATG AATATTTACC ATTTGGAGGG GGTAGTCGTC GTTGTATAGG TTCAGCTTTT 
GCTTTATTTG AAATGAAATT GGTATTGGCA ACAATTTTAT CACAGTGGGA ACTTAAGTTA 
TTGCCTAACC AAAGAATTAG CCCTGTCCGG AGAGGGTTAA CTATGGCGCC ACCAGCAAAT 
ATGCGGATGG TTGTGAAACC AAAAAAATCG TGGCAGAAAG TTAGCCAGCC TATTTTAACG 
TCTGGTTGA

Protein sequence

MTLPDGPSLS PLQRRLRTWK FIFSPLSAIE ERYSEYGDIF RTNTNSLYPF IYFCNPKAIQ 
QIFTADPDTF TSGSINGILK YFVGLNSLLL QDGDRHKRQR KLLMPPFHGD RMRKYGDLIY 
NITSNVISQW KIEQPFPIRK STQEISLKVI LAAVFGLDQE GKSYEKLRVL MSDLLDSMSS 
PLSSTFLFFN FLRKDWGPWS PWGRFLRKKQ ELHELIIAEI QTAKKEGNHR DDILSLLLEA 
RDEAGNAMSD EEIKDELLTM LFAGHETTAS ALAWALYWID MIPSVGEKLM AELATIPSNS 
DQVAITKLPY LSAICQETLR IYPIAMNAFP RVVQKPIEIM GYQLEPGMVA IVPIYLTHHR 
EDIYPEPKKF KPERFLERQF SPYEYLPFGG GSRRCIGSAF ALFEMKLVLA TILSQWELKL 
LPNQRISPVR RGLTMAPPAN MRMVVKPKKS WQKVSQPILT SG